N
Nvidia 11. 3. 2026
88 skóre

NVIDIA: Nemotron 3 Super (free)

nvidia/nemotron-3-super-120b-a12b:free

Technologicky pokročilý model ideální pro nasazení komplexních agentů, kde je kritická rychlost a přesnost, ale není vyžadována práce s obrazem.

Killer Feature Hybridní Mamba-Transformer architektura s Multi-Token Prediction pro extrémní efektivitu.
Skryté riziko Závislost na specifickém softwarovém stacku NVIDIA pro plné využití optimalizací hybridní architektury při vlastním nasazení.
$0 / 1M vstup
$0 / 1M výstup
262k kontext
262k max výstup
Výborný hodnocení
text text Autonomní agentiEfektivita inferenceProgramování a uvažování

📊 Benchmarky

💻 Programování
92
Výborný
🧠 Reasoning
88
Výborný
Rychlost
90
Výborný
📏 Kontextové okno
75
Dobrý
💰 Cena/Výkon
100
Výborný
Celkové skóre 88/100

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Nvidia Nemotron 3 Super (free)
← Právě prohlížíte
DeepSeek DeepSeek v3.2
NVIDIA je zdarma, DeepSeek velmi levný ($0.26/1M) Oba jsou špičkové MoE modely. NVIDIA těží z hybridní Mamba architektury pro lepší efektivitu u dlouhých sekvencí.
Mistral AI Devstral 2512
NVIDIA je zdarma, Mistral levný ($0.40/1M) Oba cílí na vývojáře a mají shodný kontext 262k. Nemotron 3 Super má výrazně vyšší celkovou kapacitu parametrů (120B vs menší Mistral).
NVIDIA je zdarma, Google velmi levný ($0.25/1M) Gemini nabízí 4x větší kontext a multimodalitu, NVIDIA kontruje hlubší specializací na agentní úlohy a otevřeností.

🎯 Rozhodovací pomocník

Použij když...

  • Komplexní multi-agentní systémy
  • Generování kódu a refactoring (SWE)
  • Lokální nasazení s vysokou propustností

Nepoužívej když...

  • Analýza obrázků a videa
  • Úlohy vyžadující kontext nad 300k tokenů v jednom promptu
Ideální pro:
Vývojáři AI agentůEnterprise architektiVýzkumníci optimalizace inference

💪 Silné a slabé stránky

+ Silné stránky

Efektivita a Rychlost

Díky aktivaci jen 12B parametrů a MTP technologii dosahuje o 50 % vyšší rychlosti generování než srovnatelné open modely.

Agentní schopnosti

Trénink v 10+ RL prostředích zajišťuje špičkové výsledky v benchmarcích pro agenty (SWE-Bench Verified, TerminalBench).

Poměr Cena/Výkon

Jako open-weights model dostupný zdarma (v tomto API) s výkonem konkurujícím proprietárním modelům nabízí bezkonkurenční hodnotu.

Slabé stránky

Multimodalita

Model je omezen pouze na textový vstup/výstup, zatímco konkurence (Gemini, GPT-5) nativně zpracovává obraz a další data.

Dostupný kontext

Ačkoliv architektura podporuje 1M tokenů, toto konkrétní API je omezeno na 262k, což je méně než u modelů Gemini Flash nebo Claude.

📝 Detailní popis

NVIDIA Nemotron 3 Super je otevřený hybridní MoE model se 120 miliardami parametrů, který aktivuje pouze 12 miliard parametrů pro maximální výpočetní efektivitu a přesnost ve složitých multi-agentních aplikacích. Je postaven na hybridní architektuře Mamba-Transformer Mixture-of-Experts s predikcí více tokenů (MTP) a poskytuje o více než 50 % vyšší generování tokenů ve srovnání s předními otevřenými modely.

Model disponuje kontextovým oknem o velikosti 1M tokenů pro dlouhodobou koherenci agentů, usuzování napříč dokumenty a více-krokové plánování úloh. Latentní MoE umožňuje volání 4 expertů za cenu inference pouze jednoho, čímž se zlepšuje inteligence a generalizace. Multi-environment RL trénink napříč více než 10 prostředími přináší špičkovou přesnost v benchmarkách včetně AIME 2025, TerminalBench a SWE-Bench Verified.

Nemotron 3 Super je plně otevřený s váhami, datasety a recepty pod licencí NVIDIA Open License a umožňuje snadné přizpůsobení a bezpečné nasazení kdekoli – od pracovní stanice po cloud.

Unikátní charakteristiky

Unikátní hybridní architektura kombinující Mamba (SSM) a Transformer vrstvy v nastavení Mixture-of-Experts, aktivující pouze 12B parametrů pro vysokou efektivitu. Využívá technologii Multi-Token Prediction (MTP) pro výrazně rychlejší generování textu a lepší logickou konzistenci.

Silné stránky

Efektivita a Rychlost

Díky aktivaci jen 12B parametrů a MTP technologii dosahuje o 50 % vyšší rychlosti generování než srovnatelné open modely.

Agentní schopnosti

Trénink v 10+ RL prostředích zajišťuje špičkové výsledky v benchmarcích pro agenty (SWE-Bench Verified, TerminalBench).

Poměr Cena/Výkon

Jako open-weights model dostupný zdarma (v tomto API) s výkonem konkurujícím proprietárním modelům nabízí bezkonkurenční hodnotu.

Slabé stránky

Multimodalita

Model je omezen pouze na textový vstup/výstup, zatímco konkurence (Gemini, GPT-5) nativně zpracovává obraz a další data.

Dostupný kontext

Ačkoliv architektura podporuje 1M tokenů, toto konkrétní API je omezeno na 262k, což je méně než u modelů Gemini Flash nebo Claude.

🔗 Další modely od Nvidia