DeepSeek: R1 Distill Qwen 14B

📊 Benchmarky

🧮 Věda & Matematika

65

Dobrý

💻 Programování

37.6

Slabý

🧠 Obecná inteligence

47.9

Průměrný

⚡ Rychlost

16.4

Slabý

Celkové skóre 47.6/100

💪 Silné a slabé stránky

+ Silné stránky

− Slabé stránky

📝 Detailní popis

DeepSeek R1 Distill Qwen 14B je destilovaný velký jazykový model založený na Qwen 2.5 14B, využívající výstupy z DeepSeek R1. Překonává o1-mini od OpenAI v různých benchmarkách a dosahuje nových nejlepších výsledků (state-of-the-art) pro husté modely.

Další výsledky benchmarků zahrnují:

AIME 2024 pass@1: 69.7
MATH-500 pass@1: 93.9
CodeForces Rating: 1481

Model využívá jemné doladění (fine-tuning) z výstupů DeepSeek R1, což umožňuje konkurenceschopný výkon srovnatelný s většími špičkovými modely (frontier models).

📊 Benchmarky

💪 Silné a slabé stránky

+ Silné stránky

− Slabé stránky

📝 Detailní popis

🔗 Další modely od DeepSeek