NVIDIA: Nemotron 3 Super (free)

nvidia/nemotron-3-super-120b-a12b:free

Technologicky pokročilý model ideální pro nasazení komplexních agentů, kde je kritická rychlost a přesnost, ale není vyžadována práce s obrazem.

✦

Killer Feature Hybridní Mamba-Transformer architektura s Multi-Token Prediction pro extrémní efektivitu.

⚠

Skryté riziko Závislost na specifickém softwarovém stacku NVIDIA pro plné využití optimalizací hybridní architektury při vlastním nasazení.

$0 / 1M vstup

$0 / 1M výstup

262k kontext

262k max výstup

Výborný hodnocení

text text Autonomní agentiEfektivita inferenceProgramování a uvažování

⚖️ Porovnání s konkurencí

Model	Cenové srovnání	Poznámka
Nvidia Nemotron 3 Super (free)	← Právě prohlížíte	—
DeepSeek DeepSeek v3.2	NVIDIA je zdarma, DeepSeek velmi levný ($0.26/1M)	Oba jsou špičkové MoE modely. NVIDIA těží z hybridní Mamba architektury pro lepší efektivitu u dlouhých sekvencí.
Mistral AI Devstral 2512	NVIDIA je zdarma, Mistral levný ($0.40/1M)	Oba cílí na vývojáře a mají shodný kontext 262k. Nemotron 3 Super má výrazně vyšší celkovou kapacitu parametrů (120B vs menší Mistral).
Google Gemini 3.1 Flash Lite	NVIDIA je zdarma, Google velmi levný ($0.25/1M)	Gemini nabízí 4x větší kontext a multimodalitu, NVIDIA kontruje hlubší specializací na agentní úlohy a otevřeností.

🎯 Rozhodovací pomocník

✓

Použij když...

Komplexní multi-agentní systémy
Generování kódu a refactoring (SWE)
Lokální nasazení s vysokou propustností

✗

Nepoužívej když...

Analýza obrázků a videa
Úlohy vyžadující kontext nad 300k tokenů v jednom promptu

Ideální pro:

Vývojáři AI agentůEnterprise architektiVýzkumníci optimalizace inference

💪 Silné a slabé stránky

+ Silné stránky

Efektivita a Rychlost

Díky aktivaci jen 12B parametrů a MTP technologii dosahuje o 50 % vyšší rychlosti generování než srovnatelné open modely.

Agentní schopnosti

Trénink v 10+ RL prostředích zajišťuje špičkové výsledky v benchmarcích pro agenty (SWE-Bench Verified, TerminalBench).

Poměr Cena/Výkon

Jako open-weights model dostupný zdarma (v tomto API) s výkonem konkurujícím proprietárním modelům nabízí bezkonkurenční hodnotu.

− Slabé stránky

Multimodalita

Model je omezen pouze na textový vstup/výstup, zatímco konkurence (Gemini, GPT-5) nativně zpracovává obraz a další data.

Dostupný kontext

Ačkoliv architektura podporuje 1M tokenů, toto konkrétní API je omezeno na 262k, což je méně než u modelů Gemini Flash nebo Claude.

📝 Detailní popis

NVIDIA Nemotron 3 Super je otevřený hybridní MoE model se 120 miliardami parametrů, který aktivuje pouze 12 miliard parametrů pro maximální výpočetní efektivitu a přesnost ve složitých multi-agentních aplikacích. Je postaven na hybridní architektuře Mamba-Transformer Mixture-of-Experts s predikcí více tokenů (MTP) a poskytuje o více než 50 % vyšší generování tokenů ve srovnání s předními otevřenými modely.

Model disponuje kontextovým oknem o velikosti 1M tokenů pro dlouhodobou koherenci agentů, usuzování napříč dokumenty a více-krokové plánování úloh. Latentní MoE umožňuje volání 4 expertů za cenu inference pouze jednoho, čímž se zlepšuje inteligence a generalizace. Multi-environment RL trénink napříč více než 10 prostředími přináší špičkovou přesnost v benchmarkách včetně AIME 2025, TerminalBench a SWE-Bench Verified.

Nemotron 3 Super je plně otevřený s váhami, datasety a recepty pod licencí NVIDIA Open License a umožňuje snadné přizpůsobení a bezpečné nasazení kdekoli – od pracovní stanice po cloud.

Unikátní charakteristiky

Unikátní hybridní architektura kombinující Mamba (SSM) a Transformer vrstvy v nastavení Mixture-of-Experts, aktivující pouze 12B parametrů pro vysokou efektivitu. Využívá technologii Multi-Token Prediction (MTP) pro výrazně rychlejší generování textu a lepší logickou konzistenci.

Silné stránky

Efektivita a Rychlost