D
Deepseek 23. 1. 2025
88 skóre

DeepSeek: R1 Distill Llama 70B

deepseek/deepseek-r1-distill-llama-70b

Extrémně efektivní volba pro náročné logické úlohy, která díky agresivní cenové politice a destilaci překonává poměr cena/výkon většiny trhu.

Killer Feature Kombinace výkonu na úrovni SOTA modelů v matematice (AIME 70.0) s komoditní cenou $0.03/1M.
Skryté riziko Jako destilovaný model může v okrajových případech halucinovat logické kroky, pokud narazí na data mimo distribuci učitele (R1).
$0.03 / 1M vstup
$0.11 / 1M výstup
131k kontext
131k max výstup
Výborný hodnocení
text text Pokročilé uvažování (Reasoning)MatematikaGenerování kódu

📊 Benchmarky

🧠 Reasoning (Logika)
95
Výborný
💻 Programování
90
Výborný
💰 Cena/Výkon
99
Výborný
📏 Kontextové okno
70
Dobrý
👁️ Multimodalita
0
Slabý
Celkové skóre 88/100

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Deepseek R1 Distill Llama 70B
← Právě prohlížíte
DeepSeek je o 40 % levnější na vstupu a 50 % levnější na výstupu. Mistral nabízí větší kontext (262k), ale DeepSeek pravděpodobně dominuje v čisté logice a matematice.
DeepSeek je cca 6x levnější na vstupu a 13x levnější na výstupu. Grok je specializovaný na rychlost a má větší kontext, DeepSeek nabízí hlubší reasoning za zlomek ceny.
R1 Distill je výrazně levnější (cca 9x) než standardní V3.2 řada. V3.2 je pravděpodobně univerzálnější (general purpose), zatímco R1 Distill je úzce zaměřen na logiku a STEM úlohy.

🎯 Rozhodovací pomocník

Použij když...

  • Řešení matematických problémů
  • Generování a debugování složitého kódu
  • Analýza dat vyžadující dedukci

Nepoužívej když...

  • Analýzu velmi dlouhých dokumentů (>130k tokenů)
  • Zpracování obrázků nebo audia
  • Jednoduché chatboty vyžadující extrémně nízkou latenci
Ideální pro:
Vývojáři vyžadující komplexní logikuVědečtí pracovníciFirmy optimalizující náklady na API

💪 Silné a slabé stránky

+ Silné stránky

Matematický výkon

Skóre 94.5 na MATH-500 a 70.0 na AIME 2024 jej řadí na úroveň mnohem větších frontier modelů.

Poměr cena/výkon

S cenou $0.03 za 1M vstupních tokenů je řádově levnější než konkurence s podobnou kognitivní schopností.

Programování

CodeForces Rating 1633 indikuje silné schopnosti v algoritmickém programování.

Slabé stránky

Multimodalita

Model je omezen pouze na textový vstup a výstup, chybí zpracování obrazu či zvuku, které nabízí Gemini nebo GPT-Audio.

Kontextové okno

Kapacita 131k tokenů je dostatečná, ale zaostává za modely s 1M+ kontextem (Gemini, Claude, Grok).

📝 Detailní popis

DeepSeek R1 Distill Llama 70B je destilovaný velký jazykový model založený na Llama-3.3-70B-Instruct, využívající výstupy z DeepSeek R1. Model kombinuje pokročilé destilační techniky k dosažení vysokého výkonu v několika benchmarkách, včetně:

  • AIME 2024 pass@1: 70.0
  • MATH-500 pass@1: 94.5
  • CodeForces Rating: 1633

Model využívá doladění z výstupů DeepSeek R1, což umožňuje konkurenceschopný výkon srovnatelný s většími špičkovými modely.

Unikátní charakteristiky

Tento model využívá techniku destilace znalostí z výkonnějšího modelu DeepSeek R1 do architektury Llama-3.3-70B. Díky tomu dosahuje špičkových výsledků v matematických a logických úlohách při zachování efektivity 70B modelu. Je specificky optimalizován pro řetězec myšlenek (Chain of Thought) a řešení komplexních problémů.

Silné stránky

Matematický výkon

Skóre 94.5 na MATH-500 a 70.0 na AIME 2024 jej řadí na úroveň mnohem větších frontier modelů.

Poměr cena/výkon

S cenou $0.03 za 1M vstupních tokenů je řádově levnější než konkurence s podobnou kognitivní schopností.

Programování

CodeForces Rating 1633 indikuje silné schopnosti v algoritmickém programování.

Slabé stránky

Multimodalita

Model je omezen pouze na textový vstup a výstup, chybí zpracování obrazu či zvuku, které nabízí Gemini nebo GPT-Audio.

Kontextové okno

Kapacita 131k tokenů je dostatečná, ale zaostává za modely s 1M+ kontextem (Gemini, Claude, Grok).

🔗 Další modely od Deepseek