O
Openai 5. 8. 2025
88 skóre

OpenAI: gpt-oss-120b

openai/gpt-oss-120b

Agresivní krok OpenAI do open-weight segmentu, který díky extrémní efektivitě a nízké ceně prakticky likviduje ekonomický smysl používání starších 'mid-size' modelů.

Killer Feature Možnost běhu 117B modelu na jediném H100 GPU díky 5.1B aktivním parametrům a MXFP4.
Skryté riziko Relativně malé kontextové okno (131k) může být limitující pro moderní 'long-context' aplikace, kde je standardem 1M+.
$0.04 / 1M vstup
$0.19 / 1M výstup
131k kontext
Výborný hodnocení
text text Efektivní inferenceAgentní systémyReasoning

📊 Benchmarky

🧠 Reasoning
92
Výborný
💻 Programování
88
Výborný
💰 Cena/Výkon
98
Výborný
Rychlost
90
Výborný
📏 Kontextové okno
65
Průměrný
🤖 Agenti
94
Výborný
Celkové skóre 88/100

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Openai gpt-oss-120b
← Právě prohlížíte
MistralAI devstral-2512
GPT-OSS je o 20 % levnější na vstupu ($0.04 vs $0.05), výstup je srovnatelný. Mistral nabízí dvojnásobný kontext (262k), ale GPT-OSS pravděpodobně nabídne vyšší kvalitu uvažování díky většímu celkovému počtu parametrů.
DeepSeek deepseek-v3.2
GPT-OSS je přibližně 6x levnější na vstupu a 2x levnější na výstupu. DeepSeek byl dříve králem efektivity, ale gpt-oss-120b jej agresivně podstřeluje cenou při podobné architektuře MoE.
GPT-OSS je 5x levnější na vstupu ($0.04 vs $0.20). Grok dominuje v délce kontextu (2M tokenů), ale pro běžné úlohy bez nutnosti extrémního kontextu je GPT-OSS ekonomicky výhodnější.

🎯 Rozhodovací pomocník

Použij když...

  • Komplexní RAG s vysokou propustností
  • Generování strukturovaných dat (JSON extraction)
  • Code reasoning a debugging

Nepoužívej když...

  • Analýza extrémně dlouhých dokumentů (>130k tokenů)
  • Multimodální vstupy (obrázky, video)
Ideální pro:
Vývojáři autonomních agentůEnterprise s vlastní infrastrukturou (on-prem)High-volume API spotřebitelé

💪 Silné a slabé stránky

+ Silné stránky

Cena/Výkon

S cenou $0.04 za 1M vstupních tokenů je model levnější než většina 'small' modelů konkurence, přičemž nabízí parametry třídy 100B+.

Hardwarová efektivita

Díky aktivaci pouze 5.1B parametrů a MXFP4 optimalizaci umožňuje nasazení modelu této velikosti na jediné kartě H100, což drasticky snižuje náklady na inferenci.

Agentní schopnosti

Nativní podpora pro volání funkcí (tool use) a konfigurovatelná hloubka uvažování (reasoning depth) jej předurčuje pro komplexní autonomní úlohy.

Slabé stránky

Kontextové okno

Kapacita 131,072 tokenů je v prosinci 2025 podprůměrná ve srovnání s konkurencí nabízející běžně 200k až 2M tokenů.

Omezená multimodalita

Model je striktně text-to-text, chybí nativní zpracování obrazu či audia, které nabízí modely řady Gemini nebo GPT-4o.

📝 Detailní popis

gpt-oss-120b je jazykový model typu Mixture-of-Experts (MoE) s otevřenými váhami a 117 miliardami parametrů od OpenAI, navržený pro vysoce náročné, agentní a všeobecné produkční případy použití. Aktivuje 5,1 miliardy parametrů na jeden průchod dopřednou sítí a je optimalizován pro běh na jedné GPU H100 s nativní kvantizací MXFP4. Model podporuje konfigurovatelnou hloubku usuzování, plný přístup k řetězci myšlenek a nativní používání nástrojů, včetně volání funkcí, procházení webu a generování strukturovaného výstupu.

Unikátní charakteristiky

Tento model představuje strategický posun OpenAI k open-weight distribuci s extrémní efektivitou, využívající architekturu MoE s pouze 5.1B aktivními parametry pro běh na jediném GPU H100. Kombinuje nativní kvantizaci MXFP4 s pokročilými schopnostmi ‘reasoning’ modelů a strukturovaným výstupem.

Silné stránky

Cena/Výkon

S cenou $0.04 za 1M vstupních tokenů je model levnější než většina ‘small’ modelů konkurence, přičemž nabízí parametry třídy 100B+.

Hardwarová efektivita

Díky aktivaci pouze 5.1B parametrů a MXFP4 optimalizaci umožňuje nasazení modelu této velikosti na jediné kartě H100, což drasticky snižuje náklady na inferenci.

Agentní schopnosti

Nativní podpora pro volání funkcí (tool use) a konfigurovatelná hloubka uvažování (reasoning depth) jej předurčuje pro komplexní autonomní úlohy.

Slabé stránky

Kontextové okno

Kapacita 131,072 tokenů je v prosinci 2025 podprůměrná ve srovnání s konkurencí nabízející běžně 200k až 2M tokenů.

Omezená multimodalita

Model je striktně text-to-text, chybí nativní zpracování obrazu či audia, které nabízí modely řady Gemini nebo GPT-4o.

🔗 Další modely od Openai