M
Mistral 10. 7. 2025
35.2 skóre

Mistral: Devstral Medium

mistralai/devstral-medium

Devstral Medium je vhodný pro vývojáře, kteří hledají cenově efektivní řešení pro generování kódu a automatizaci úloh pomocí agentů, ale měli by zvážit jeho omezení v obecné inteligenci a jazykové podpoře.

Killer Feature Vynikající poměr cena/výkon v generování kódu.
Skryté riziko Slabší výkon v oblastech mimo kódování a agentní uvažování, neznámá kvalita češtiny.
$0.4 / 1M vstup
$2 / 1M výstup
131k kontext
Slabý hodnocení
text text Generování kóduAgentní uvažování

📊 Benchmarky

🧮 Věda & Matematika
36.5
Slabý
💻 Programování
33.7
Slabý
🤖 Agenti & Nástroje
19.9
Slabý
🧠 Obecná inteligence
45.7
Průměrný
Rychlost
55.8
Průměrný
Celkové skóre 35.2/100

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Mistral Devstral Medium
← Právě prohlížíte
Levnější vstup, dražší výstup Gemini 2.5 Flash Image je levnější na vstupu, ale Devstral Medium má lepší kontext a pravděpodobně lepší výkon v kódování.
Dražší vstup i výstup GPT-5.1 Codex Max je dražší, ale může nabízet lepší obecnou inteligenci a širší škálu schopností (data nejsou k dispozici).
Levnější vstup, levnější výstup Grok-code-fast-1 je výrazně levnější, ale může mít horší výkon v náročnějších kódovacích úlohách (data nejsou k dispozici).
Levnější vstup, levnější výstup Deepseek v3.2 je levnější, ale Devstral Medium má větší kontext a pravděpodobně lepší výkon v agentním uvažování.

🎯 Rozhodovací pomocník

Použij když...

  • Generování kódu
  • Automatizace úloh pomocí agentů

Nepoužívej když...

  • Úlohy vyžadující vysokou úroveň matematických schopností
  • Aplikace vyžadující silnou podporu češtiny
Ideální pro:
Vývojáři softwaruAI inženýři

💪 Silné a slabé stránky

+ Silné stránky

Generování kódu

Dosahuje 61.6% na SWE-Bench Verified, což je lepší než Gemini 2.5 Pro a GPT-4.1.

Cena

Nabízí srovnatelný výkon jako dražší modely (Gemini, GPT-4) za výrazně nižší cenu.

Slabé stránky

Obecná inteligence

Celkové skóre 36.4/100 naznačuje slabší výkon v oblastech mimo kódování a agentní uvažování.

Čeština

MMMLU skóre pro češtinu není k dispozici, což ztěžuje posouzení použitelnosti v českém jazyce.

📝 Detailní popis

Devstral Medium je vysoce výkonný model pro generování kódu a agentní usuzování, vyvinutý společně společnostmi Mistral AI a All Hands AI. Je koncipován jako vylepšení oproti Devstral Small a dosahuje 61,6 % na SWE-Bench Verified, čímž v úlohách souvisejících s kódem předčí Gemini 2.5 Pro a GPT-4.1, a to za zlomek nákladů. Je navržen pro generalizaci napříč styly promptů a používání nástrojů v kódových agentech a frameworkách.

Devstral Medium je dostupný pouze přes API (není open-weight) a podporuje nasazení v podnikovém prostředí na soukromé infrastruktuře, s volitelnými možnostmi fine-tuningu.

Unikátní charakteristiky

Devstral Medium vyniká v generování kódu a agentním uvažování, s výkonem srovnatelným s Gemini 2.5 Pro a GPT-4.1 v kódovacích úlohách, ale za zlomek ceny. Je navržen pro generalizaci napříč různými styly promptů a pro použití nástrojů v kódovacích agentech a frameworkách.

Silné stránky

Generování kódu

Dosahuje 61.6% na SWE-Bench Verified, což je lepší než Gemini 2.5 Pro a GPT-4.1.

Cena

Nabízí srovnatelný výkon jako dražší modely (Gemini, GPT-4) za výrazně nižší cenu.

Slabé stránky

Obecná inteligence

Celkové skóre 36.4/100 naznačuje slabší výkon v oblastech mimo kódování a agentní uvažování.

Čeština

MMMLU skóre pro češtinu není k dispozici, což ztěžuje posouzení použitelnosti v českém jazyce.

🔗 Další modely od Mistral