gpt-oss-20b je 21B parametrový model s otevřenými váhami, vydaný společností OpenAI pod licencí Apache 2.0. Používá architekturu Mixture-of-Experts (MoE) s 3,6B aktivními parametry na jeden průchod dopřednou sítí, optimalizovanou pro inferenci s nižší latencí a nasazení na spotřebitelském hardwaru nebo hardwaru s jednou GPU. Model je trénován ve formátu odpovědí Harmony společnosti OpenAI a podporuje konfiguraci úrovně usuzování, jemné doladění a schopnosti agenta, včetně volání funkcí, používání nástrojů a strukturovaných výstupů.
Unikátní charakteristiky
Tento model představuje významný posun OpenAI k open-weight distribuci pod licencí Apache 2.0, cílící na komunitu open-source vývojářů. Díky architektuře MoE s pouze 3,6 miliardami aktivních parametrů umožňuje běh na běžném spotřebitelském hardwaru při zachování schopností srovnatelných s většími modely v oblasti strukturovaných výstupů.
Silné stránky
Extrémní efektivita nákladů
S cenou $0.02 za 1M vstupních tokenů je model 2,5x levnější než nejbližší konkurent (Devstral) a 10x levnější než Grok-fast.
Nasazení na Edge/Consumer HW
Pouze 3,6B aktivních parametrů umožňuje inferenci na jedné GPU střední třídy nebo výkonných laptopech s nízkou latencí.
Agentní schopnosti
Nativní podpora pro function calling a strukturované výstupy (Harmony format) optimalizovaná pro spolehlivé ovládání nástrojů.
Slabé stránky
Hloubka znalostí
S 21B parametry nemůže konkurovat ‘frontier’ modelům (jako Claude Opus nebo GPT-5) v encyklopedických znalostech a komplexním uvažování.
Kontextové okno
Kapacita 131 072 tokenů je dostatečná, ale zaostává za konkurencí v podobné třídě (Grok má 2M, Gemini 1M+).