OpenAI o3-mini-high je stejný model jako o3-mini s nastaveným parametrem reasoning_effort na hodnotu high (vysoká).
o3-mini je nákladově efektivní jazykový model optimalizovaný pro úlohy STEM (věda, technologie, inženýrství a matematika) vyžadující usuzování, přičemž vyniká zejména ve vědě, matematice a kódování. Model nabízí tři nastavitelné úrovně úsilí pro usuzování (reasoning effort) a podporuje klíčové vývojářské funkce, včetně volání funkcí (function calling), strukturovaných výstupů a streamování, i když nezahrnuje schopnosti zpracování obrazu (vision processing).
Model vykazuje významné zlepšení oproti svému předchůdci, přičemž odborní testeři preferovali jeho odpovědi v 56 % případů a zaznamenali 39% snížení závažných chyb u složitých otázek. S nastavením středního úsilí pro usuzování (medium reasoning effort) dosahuje o3-mini výkonu většího modelu o1 v náročných hodnoceních usuzování, jako jsou AIME a GPQA, přičemž si zachovává nižší latenci a náklady.
Unikátní charakteristiky
Model o3-mini-high využívá techniku ‘reasoning tokens’ s nastavením vysokého úsilí, což mu umožňuje věnovat více výpočetního času internímu uvažování před generováním odpovědi. Ačkoliv jde o menší model, díky této metodě dosahuje v benchmarcích (AIME, GPQA) výsledků srovnatelných s mnohem většími modely, přičemž podporuje masivní výstupní okno 100 000 tokenů.
Silné stránky
STEM a Programování
Díky nastavení ‘high reasoning’ dosahuje model špičkové přesnosti v matematice a psaní složitého kódu, kde překonává standardní modely bez CoT.
Výstupní kapacita
Podpora generování až 100 000 tokenů v jedné odpovědi je ideální pro vytváření rozsáhlých softwarových modulů nebo detailních technických analýz.
Poměr cena/výkon
Nabízí schopnosti uvažování na úrovni ‘Pro’ modelů za cenu ($1.10/$4.40), která je výrazně nižší než u vlajkových lodí konkurence.
Slabé stránky
Absence vizuálních vstupů
Model nepodporuje zpracování obrázků (vision), což omezuje jeho využití v multimodálních úlohách oproti konkurenci jako Claude Sonnet nebo Gemini.
Latence
Vysoké nastavení ‘reasoning effort’ znamená, že model před odpovědí déle ‘přemýšlí’, což zvyšuje latenci a činí jej nevhodným pro chat v reálném čase.