DeepSeek: R1 Distill Qwen 32B

deepseek/deepseek-r1-distill-qwen-32b

Vysoce specializovaný model, který za zlomkovou cenu přináší schopnosti uvažování na úrovni frontier modelů, ideální pro matematiku a kódování, pokud vás nelimituje menší kontext.

✦

Killer Feature Schopnost 'chain-of-thought' uvažování destilovaná do efektivního 32B modelu za cenu $0.29/1M.

⚠

Skryté riziko Malé kontextové okno (32k) může způsobit selhání u složitějších úloh vyžadujících mnoho vstupních informací.

$0.29 / 1M vstup

$0.29 / 1M výstup

33k kontext

Dobrý hodnocení

text text Pokročilé logické uvažování (Reasoning)Matematika a STEM úlohyGenerování kódu

⚖️ Porovnání s konkurencí

Model	Cenové srovnání	Poznámka
Deepseek R1 Distill Qwen 32B	← Právě prohlížíte	—
MistralAI Mistral Ministral 14B	O cca 30 % levnější na vstupu i výstupu	Ministral nabízí 8x větší kontext (262k) a nižší latenci, ale DeepSeek R1 Distill má výrazně vyšší přesnost v logických úlohách.
X-AI Grok 4.1 Fast	Levnější vstup ($0.20), ale dražší výstup ($0.50)	Grok dominuje v kontextu (2M tokenů) a rychlosti, DeepSeek je vhodnější pro úlohy vyžadující hluboké uvažování a přesnost.
DeepSeek DeepSeek V3.2	Velmi podobná cenová hladina ($0.25/$0.38)	V3.2 je univerzálnější model s větším kontextem (164k), zatímco R1 Distill je specialista na 'heavy reasoning' a matematiku.

🎯 Rozhodovací pomocník

✓

Použij když...

Řešení komplexních algoritmických problémů
Automatizované matematické důkazy
Generování syntetických trénovacích dat pro reasoning

✗

Nepoužívej když...

Analýzu dlouhých právních dokumentů (limit kontextu)
Zpracování vizuálních vstupů
Jednoduché chatovací aplikace vyžadující extrémně nízkou latenci

Ideální pro:

Vývojáři softwaruDatoví analyticiVýzkumníci v STEM oborech

💪 Silné a slabé stránky

+ Silné stránky

Matematické uvažování

Dosahuje skóre 94.3 na MATH-500 a 72.6 na AIME 2024, což překonává i specializované modely jako o1-mini v dané kategorii.

Poměr cena/výkon

S cenou $0.29 za 1M tokenů nabízí úroveň inteligence, která byla dříve dostupná pouze u modelů s cenou nad $5-10/1M.

Programování

CodeForces rating 1691 naznačuje silnou schopnost řešit algoritmické problémy, nikoliv jen generovat boilerplate kód.

− Slabé stránky

Kontextové okno

Kapacita 32,768 tokenů je na poměry konce roku 2025 podprůměrná a omezuje použití pro analýzu rozsáhlých dokumentů.

Multimodalita

Model je čistě textový (text-to-text), chybí schopnost zpracovávat obrázky nebo audio, což konkurence v této třídě často nabízí.

📝 Detailní popis

DeepSeek R1 Distill Qwen 32B je destilovaný velký jazykový model založený na Qwen 2.5 32B, využívající výstupy z DeepSeek R1. Překonává o1-mini od OpenAI v různých benchmarkách a dosahuje nových nejlepších výsledků pro husté modely.

Další výsledky benchmarků zahrnují:

AIME 2024 pass@1: 72.6
MATH-500 pass@1: 94.3
CodeForces Rating: 1691

Model využívá doladění z výstupů DeepSeek R1, což umožňuje konkurenceschopný výkon srovnatelný s většími špičkovými modely.

Unikátní charakteristiky

Tento model využívá techniku destilace znalostí z většího modelu DeepSeek R1 do architektury Qwen 2.5 32B, čímž dosahuje schopností uvažování (chain-of-thought) srovnatelných s mnohem většími modely při zachování efektivity dense modelu. Je specificky optimalizován pro řešení komplexních matematických a programovacích úloh.

Silné stránky

Matematické uvažování