M
Mistral 7. 5. 2025
43.5 skóre

Mistral: Mistral Medium 3

mistralai/mistral-medium-3

Mistral Medium 3 je vhodný pro uživatele, kteří hledají cenově dostupný model s dobrým výkonem v oblasti vědy a matematiky, ale měli by zvážit jeho omezení v logickém uvažování.

Killer Feature Vynikající poměr cena/výkon pro vědecké a matematické úlohy.
Skryté riziko Slabé logické uvažování může omezit použitelnost v komplexních úlohách.
$0.4 / 1M vstup
$2 / 1M výstup
131k kontext
Průměrný hodnocení
textimage text KódováníSTEM reasoning

📊 Benchmarky

🧮 Věda & Matematika
58.9
Průměrný
💻 Programování
40
Průměrný
🤖 Agenti & Nástroje
24.3
Slabý
🧠 Obecná inteligence
49.1
Průměrný
Rychlost
50.3
Průměrný
Celkové skóre 43.5/100

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Mistral Mistral Medium 3
← Právě prohlížíte
3.75x dražší vstup, 7.5x dražší výstup Claude Sonnet 4.5 má větší kontext (1,000,000 tokenů) a může být lepší v komplexnějších úlohách, ale je výrazně dražší.
5x dražší výstup Gemini 3 Pro Image Preview nabízí multimodální schopnosti, ale s menším kontextem (65,536 tokenů) a vyšší cenou za výstup.
2x levnější vstup, 4x levnější výstup Grok-4.1-fast je levnější a má větší kontext (2,000,000 tokenů), ale jeho výkon v benchmarkách není znám.
2x levnější vstup i výstup Ministral-14b-2512 je levnější, ale jeho výkon v benchmarkách není k dispozici.

🎯 Rozhodovací pomocník

Použij když...

  • Matematické modelování
  • Analýza dat
  • Generování kódu

Nepoužívej když...

  • Úlohy vyžadující silné logické uvažování
  • Aplikace s vysokými nároky na češtinu
Ideální pro:
VýzkumníciPodniky s omezeným rozpočtemVývojáři aplikací

💪 Silné a slabé stránky

+ Silné stránky

Věda a matematika

Vysoké skóre v matematických úlohách, zejména MATH-500 (90.7%) a GPQA Diamond (57.8%), naznačuje silné schopnosti v STEM oblastech.

Cena a výkon

Nabízí konkurenceschopný výkon za nižší cenu ve srovnání s většími modely, což z něj činí atraktivní volbu pro nasazení ve velkém měřítku.

Slabé stránky

Logické uvažování

Slabé výsledky v HLE (4.3%) a terminalbench_hard (3.5%) naznačují omezené schopnosti v oblasti hard logic.

Čeština

MMMLU skóre pro češtinu není k dispozici, takže nelze posoudit kvalitu modelu v tomto jazyce.

📝 Detailní popis

Mistral Medium 3 je vysoce výkonný jazykový model podnikové třídy navržený tak, aby poskytoval možnosti na špičkové úrovni při výrazně snížených provozních nákladech. Vyvažuje nejmodernější usuzování a multimodální výkon s 8× nižšími náklady ve srovnání s tradičními velkými modely, díky čemuž je vhodný pro škálovatelná nasazení v profesionálních a průmyslových případech použití.

Model vyniká v oblastech, jako je kódování, STEM usuzování a podniková adaptace. Podporuje hybridní, on-prem a in-VPC nasazení a je optimalizován pro integraci do vlastních pracovních postupů. Mistral Medium 3 nabízí konkurenceschopnou přesnost ve srovnání s většími modely, jako jsou Claude Sonnet 3.5/3.7, Llama 4 Maverick a Command R+, přičemž si zachovává širokou kompatibilitu napříč cloudovými prostředími.

Unikátní charakteristiky

Mistral Medium 3 se zaměřuje na vyvážení výkonu a ceny, nabízí multimodální schopnosti (text, image → text) a velký kontext 131 072 tokenů. Vyniká ve vědeckých a matematických úlohách, což dokazuje vysoké skóre v MATH-500 (90.7%) a GPQA Diamond (57.8%).

Silné stránky

Věda a matematika

Vysoké skóre v matematických úlohách, zejména MATH-500 (90.7%) a GPQA Diamond (57.8%), naznačuje silné schopnosti v STEM oblastech.

Cena a výkon

Nabízí konkurenceschopný výkon za nižší cenu ve srovnání s většími modely, což z něj činí atraktivní volbu pro nasazení ve velkém měřítku.

Slabé stránky

Logické uvažování

Slabé výsledky v HLE (4.3%) a terminalbench_hard (3.5%) naznačují omezené schopnosti v oblasti hard logic.

Čeština

MMMLU skóre pro češtinu není k dispozici, takže nelze posoudit kvalitu modelu v tomto jazyce.

🔗 Další modely od Mistral