MiniMax-M2.5 je nejmodernější (SOTA) velký jazykový model navržený pro produktivitu v reálném světě. M2.5, trénovaný v rozmanité škále komplexních digitálních pracovních prostředí reálného světa, staví na odbornosti v kódování modelu M2.1 a rozšiřuje se do obecné kancelářské práce, dosahuje plynulosti v generování a ovládání souborů Word, Excel a Powerpoint, přepínání kontextu mezi různými softwarovými prostředími a spolupráci mezi různými týmy agentů a lidí. S výsledky 80,2 % na SWE-Bench Verified, 51,3 % na Multi-SWE-Bench a 76,3 % na BrowseComp je M2.5 také efektivnější z hlediska tokenů než předchozí generace, protože byl trénován k optimalizaci svých akcí a výstupů prostřednictvím plánování.
Unikátní charakteristiky
MiniMax M2.5 se specializuje na ‘agentní’ pracovní toky s extrémní kapacitou pro generování výstupu (až 131 072 tokenů), což je násobně více než u standardních modelů. Model je specificky dotrénován pro manipulaci se soubory Microsoft Office a vykazuje vysokou úspěšnost v plánování komplexních úloh, což potvrzuje skóre 80,2 % v SWE-Bench Verified.
Silné stránky
Agentní kódování
Skóre 80,2 % v SWE-Bench Verified a 51,3 % v Multi-SWE-Bench řadí model mezi špičku v autonomním řešení softwarových problémů.
Generativní kapacita
Maximální výstup 131 072 tokenů umožňuje generovat celé reporty nebo rozsáhlé moduly kódu na jeden průchod, kde konkurence často končí na 4k-8k tokenech.
Office integrace
Unikátní trénink zaměřený na strukturu a logiku souborů Word, Excel a PowerPoint pro přímou aplikaci v administrativě.
Slabé stránky
Cena výstupu
Zatímco vstup je levný ($0.30), výstup ($1.20) je výrazně dražší než u modelů DeepSeek ($0.38) nebo Mistral ($0.22), což prodražuje dlouhé generování.
Multimodalita
Omezení pouze na text-to-text znevýhodňuje model oproti Gemini 3 nebo GPT-5.2 v úlohách vyžadujících vizuální analýzu UI.
Vstupní kontext
Kontext 204k tokenů je dostatečný, ale zaostává za 1M+ standardem u modelů Gemini 3 Flash, Claude Opus a Grok.