D
Deepseek 30. 1. 2025
82 skóre

DeepSeek: R1 Distill Qwen 32B

deepseek/deepseek-r1-distill-qwen-32b

Vysoce specializovaný model, který za zlomkovou cenu přináší schopnosti uvažování na úrovni frontier modelů, ideální pro matematiku a kódování, pokud vás nelimituje menší kontext.

Killer Feature Schopnost 'chain-of-thought' uvažování destilovaná do efektivního 32B modelu za cenu $0.29/1M.
Skryté riziko Malé kontextové okno (32k) může způsobit selhání u složitějších úloh vyžadujících mnoho vstupních informací.
$0.29 / 1M vstup
$0.29 / 1M výstup
33k kontext
Dobrý hodnocení
text text Pokročilé logické uvažování (Reasoning)Matematika a STEM úlohyGenerování kódu

📊 Benchmarky

🧠 Reasoning & Logika
96
Výborný
💻 Programování
92
Výborný
💰 Cena/Výkon
95
Výborný
📏 Kontextové okno
45
Slabý
Rychlost
70
Dobrý
Celkové skóre 82/100

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Deepseek R1 Distill Qwen 32B
← Právě prohlížíte
O cca 30 % levnější na vstupu i výstupu Ministral nabízí 8x větší kontext (262k) a nižší latenci, ale DeepSeek R1 Distill má výrazně vyšší přesnost v logických úlohách.
Levnější vstup ($0.20), ale dražší výstup ($0.50) Grok dominuje v kontextu (2M tokenů) a rychlosti, DeepSeek je vhodnější pro úlohy vyžadující hluboké uvažování a přesnost.
DeepSeek DeepSeek V3.2
Velmi podobná cenová hladina ($0.25/$0.38) V3.2 je univerzálnější model s větším kontextem (164k), zatímco R1 Distill je specialista na 'heavy reasoning' a matematiku.

🎯 Rozhodovací pomocník

Použij když...

  • Řešení komplexních algoritmických problémů
  • Automatizované matematické důkazy
  • Generování syntetických trénovacích dat pro reasoning

Nepoužívej když...

  • Analýzu dlouhých právních dokumentů (limit kontextu)
  • Zpracování vizuálních vstupů
  • Jednoduché chatovací aplikace vyžadující extrémně nízkou latenci
Ideální pro:
Vývojáři softwaruDatoví analyticiVýzkumníci v STEM oborech

💪 Silné a slabé stránky

+ Silné stránky

Matematické uvažování

Dosahuje skóre 94.3 na MATH-500 a 72.6 na AIME 2024, což překonává i specializované modely jako o1-mini v dané kategorii.

Poměr cena/výkon

S cenou $0.29 za 1M tokenů nabízí úroveň inteligence, která byla dříve dostupná pouze u modelů s cenou nad $5-10/1M.

Programování

CodeForces rating 1691 naznačuje silnou schopnost řešit algoritmické problémy, nikoliv jen generovat boilerplate kód.

Slabé stránky

Kontextové okno

Kapacita 32,768 tokenů je na poměry konce roku 2025 podprůměrná a omezuje použití pro analýzu rozsáhlých dokumentů.

Multimodalita

Model je čistě textový (text-to-text), chybí schopnost zpracovávat obrázky nebo audio, což konkurence v této třídě často nabízí.

📝 Detailní popis

DeepSeek R1 Distill Qwen 32B je destilovaný velký jazykový model založený na Qwen 2.5 32B, využívající výstupy z DeepSeek R1. Překonává o1-mini od OpenAI v různých benchmarkách a dosahuje nových nejlepších výsledků pro husté modely.

Další výsledky benchmarků zahrnují:

  • AIME 2024 pass@1: 72.6
  • MATH-500 pass@1: 94.3
  • CodeForces Rating: 1691

Model využívá doladění z výstupů DeepSeek R1, což umožňuje konkurenceschopný výkon srovnatelný s většími špičkovými modely.

Unikátní charakteristiky

Tento model využívá techniku destilace znalostí z většího modelu DeepSeek R1 do architektury Qwen 2.5 32B, čímž dosahuje schopností uvažování (chain-of-thought) srovnatelných s mnohem většími modely při zachování efektivity dense modelu. Je specificky optimalizován pro řešení komplexních matematických a programovacích úloh.

Silné stránky

Matematické uvažování

Dosahuje skóre 94.3 na MATH-500 a 72.6 na AIME 2024, což překonává i specializované modely jako o1-mini v dané kategorii.

Poměr cena/výkon

S cenou $0.29 za 1M tokenů nabízí úroveň inteligence, která byla dříve dostupná pouze u modelů s cenou nad $5-10/1M.

Programování

CodeForces rating 1691 naznačuje silnou schopnost řešit algoritmické problémy, nikoliv jen generovat boilerplate kód.

Slabé stránky

Kontextové okno

Kapacita 32,768 tokenů je na poměry konce roku 2025 podprůměrná a omezuje použití pro analýzu rozsáhlých dokumentů.

Multimodalita

Model je čistě textový (text-to-text), chybí schopnost zpracovávat obrázky nebo audio, což konkurence v této třídě často nabízí.

🔗 Další modely od Deepseek