OpenAI: gpt-oss-120b

openai/gpt-oss-120b

Agresivní krok OpenAI do open-weight segmentu, který díky extrémní efektivitě a nízké ceně prakticky likviduje ekonomický smysl používání starších 'mid-size' modelů.

✦

Killer Feature Možnost běhu 117B modelu na jediném H100 GPU díky 5.1B aktivním parametrům a MXFP4.

⚠

Skryté riziko Relativně malé kontextové okno (131k) může být limitující pro moderní 'long-context' aplikace, kde je standardem 1M+.

$0.04 / 1M vstup

$0.19 / 1M výstup

131k kontext

Výborný hodnocení

text text Efektivní inferenceAgentní systémyReasoning

⚖️ Porovnání s konkurencí

Model	Cenové srovnání	Poznámka
Openai gpt-oss-120b	← Právě prohlížíte	—
MistralAI devstral-2512	GPT-OSS je o 20 % levnější na vstupu ($0.04 vs $0.05), výstup je srovnatelný.	Mistral nabízí dvojnásobný kontext (262k), ale GPT-OSS pravděpodobně nabídne vyšší kvalitu uvažování díky většímu celkovému počtu parametrů.
DeepSeek deepseek-v3.2	GPT-OSS je přibližně 6x levnější na vstupu a 2x levnější na výstupu.	DeepSeek byl dříve králem efektivity, ale gpt-oss-120b jej agresivně podstřeluje cenou při podobné architektuře MoE.
X-AI grok-4.1-fast	GPT-OSS je 5x levnější na vstupu ($0.04 vs $0.20).	Grok dominuje v délce kontextu (2M tokenů), ale pro běžné úlohy bez nutnosti extrémního kontextu je GPT-OSS ekonomicky výhodnější.

🎯 Rozhodovací pomocník

✓

Použij když...

Komplexní RAG s vysokou propustností
Generování strukturovaných dat (JSON extraction)
Code reasoning a debugging

✗

Nepoužívej když...

Analýza extrémně dlouhých dokumentů (>130k tokenů)
Multimodální vstupy (obrázky, video)

Ideální pro:

Vývojáři autonomních agentůEnterprise s vlastní infrastrukturou (on-prem)High-volume API spotřebitelé

💪 Silné a slabé stránky

+ Silné stránky

Cena/Výkon

S cenou $0.04 za 1M vstupních tokenů je model levnější než většina 'small' modelů konkurence, přičemž nabízí parametry třídy 100B+.

Hardwarová efektivita

Díky aktivaci pouze 5.1B parametrů a MXFP4 optimalizaci umožňuje nasazení modelu této velikosti na jediné kartě H100, což drasticky snižuje náklady na inferenci.

Agentní schopnosti

Nativní podpora pro volání funkcí (tool use) a konfigurovatelná hloubka uvažování (reasoning depth) jej předurčuje pro komplexní autonomní úlohy.

− Slabé stránky

Kontextové okno

Kapacita 131,072 tokenů je v prosinci 2025 podprůměrná ve srovnání s konkurencí nabízející běžně 200k až 2M tokenů.

Omezená multimodalita

Model je striktně text-to-text, chybí nativní zpracování obrazu či audia, které nabízí modely řady Gemini nebo GPT-4o.

📝 Detailní popis

gpt-oss-120b je jazykový model typu Mixture-of-Experts (MoE) s otevřenými váhami a 117 miliardami parametrů od OpenAI, navržený pro vysoce náročné, agentní a všeobecné produkční případy použití. Aktivuje 5,1 miliardy parametrů na jeden průchod dopřednou sítí a je optimalizován pro běh na jedné GPU H100 s nativní kvantizací MXFP4. Model podporuje konfigurovatelnou hloubku usuzování, plný přístup k řetězci myšlenek a nativní používání nástrojů, včetně volání funkcí, procházení webu a generování strukturovaného výstupu.

Unikátní charakteristiky

Tento model představuje strategický posun OpenAI k open-weight distribuci s extrémní efektivitou, využívající architekturu MoE s pouze 5.1B aktivními parametry pro běh na jediném GPU H100. Kombinuje nativní kvantizaci MXFP4 s pokročilými schopnostmi ‘reasoning’ modelů a strukturovaným výstupem.

Silné stránky

Cena/Výkon

S cenou $0.04 za 1M vstupních tokenů je model levnější než většina ‘small’ modelů konkurence, přičemž nabízí parametry třídy 100B+.

Hardwarová efektivita