Devstral Medium je vysoce výkonný model pro generování kódu a agentní usuzování, vyvinutý společně společnostmi Mistral AI a All Hands AI. Je koncipován jako vylepšení oproti Devstral Small a dosahuje 61,6 % na SWE-Bench Verified, čímž v úlohách souvisejících s kódem předčí Gemini 2.5 Pro a GPT-4.1, a to za zlomek nákladů. Je navržen pro generalizaci napříč styly promptů a používání nástrojů v kódových agentech a frameworkách.
Devstral Medium je dostupný pouze přes API (není open-weight) a podporuje nasazení v podnikovém prostředí na soukromé infrastruktuře, s volitelnými možnostmi fine-tuningu.
Unikátní charakteristiky
Devstral Medium vyniká v generování kódu a agentním uvažování, s výkonem srovnatelným s Gemini 2.5 Pro a GPT-4.1 v kódovacích úlohách, ale za zlomek ceny. Je navržen pro generalizaci napříč různými styly promptů a pro použití nástrojů v kódovacích agentech a frameworkách.
Silné stránky
Generování kódu
Dosahuje 61.6% na SWE-Bench Verified, což je lepší než Gemini 2.5 Pro a GPT-4.1.
Cena
Nabízí srovnatelný výkon jako dražší modely (Gemini, GPT-4) za výrazně nižší cenu.
Slabé stránky
Obecná inteligence
Celkové skóre 36.4/100 naznačuje slabší výkon v oblastech mimo kódování a agentní uvažování.
Čeština
MMMLU skóre pro češtinu není k dispozici, což ztěžuje posouzení použitelnosti v českém jazyce.