DeepSeek-V3.1 je velký hybridní model pro usuzování (671B parametrů, 37B aktivních), který podporuje režimy myšlení i bez myšlení prostřednictvím šablon promptů. Rozšiřuje základ DeepSeek-V3 o dvoufázový proces tréninku s dlouhým kontextem, dosahující až 128K tokenů, a používá FP8 mikroskalování pro efektivní inferenci. Uživatelé mohou ovládat chování usuzování pomocí booleanu reasoning enabled. Více informací v naší dokumentaci
Model zlepšuje používání nástrojů, generování kódu a efektivitu usuzování, dosahuje výkonu srovnatelného s DeepSeek-R1 na obtížných benchmarkách a zároveň reaguje rychleji. Podporuje strukturované volání nástrojů, kódové agenty a vyhledávací agenty, díky čemuž je vhodný pro výzkum, kódování a agentní pracovní postupy.
Je nástupcem modelu DeepSeek V3-0324 a dosahuje dobrých výsledků v různých úlohách.
Unikátní charakteristiky
DeepSeek V3.1 je hybridní MoE model, který unikátním způsobem kombinuje schopnosti hlubokého usuzování (reasoning) s rychlou inferencí pomocí přepínatelného režimu ‘thinking’. Využívá FP8 microscaling pro vysokou efektivitu a specializuje se na strukturované volání nástrojů a kódování, přičemž dosahuje výkonu srovnatelného s modelem R1 při nižší latenci.
Silné stránky
Cena/Výkon
S cenou $0.15 za 1M vstupních tokenů nabízí jeden z nejlepších poměrů inteligence a ceny na trhu, zejména pro úlohy vyžadující komplexní analýzu.
Hybridní režim
Možnost programově zapnout nebo vypnout ‘reasoning’ (myšlení) umožňuje flexibilní využití modelu jak pro rychlé chatování, tak pro složité logické úlohy.
Agentní schopnosti
Optimalizace pro strukturované volání nástrojů (tool calling) a generování kódu činí model ideálním backendem pro autonomní agenty.
Slabé stránky
Cena výstupu
Cena výstupu ($0.75/1M) je 5x vyšší než cena vstupu, což může prodražit úlohy s dlouhými generovanými odpověďmi (např. verbose CoT).
Kontextové okno
Ačkoliv dokumentace zmiňuje až 128k, základní kontext 32k tokenů je výrazně menší než u konkurence (Grok, Gemini, Claude), která standardně nabízí 200k až 2M.