M
Meta 5. 4. 2025
43.6 skóre

Meta: Llama 4 Maverick

meta-llama/llama-4-maverick

Llama 4 Maverick je vhodný pro výzkumníky a data scientisty, kteří potřebují zpracovávat velké objemy dat a využívat multimodální vstupy, ale měli by zvážit jeho slabší stránky v logice a programování.

Killer Feature Velké kontextové okno a multimodální schopnosti
Skryté riziko Slabší logické uvažování a programovací schopnosti mohou omezit použitelnost v některých aplikacích.
$0.14 / 1M vstup
$0.68 / 1M výstup
1.0M kontext
8k max výstup
Průměrný hodnocení
textimage text Multimodální interakceVysoká propustnost

📊 Benchmarky

🧮 Věda & Matematika
60.2
Dobrý
💻 Programování
39.7
Slabý
🤖 Agenti & Nástroje
17.8
Slabý
🧠 Obecná inteligence
52.4
Průměrný
Rychlost
61.4
Dobrý
Celkové skóre 43.6/100

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Meta Llama 4 Maverick
← Právě prohlížíte
Výrazně dražší (cca 35x vstup, 36x výstup) Claude Opus je silnější v obecné inteligenci, ale dražší.
Dražší (cca 14x vstup, 17x výstup) Gemini 3 Pro nabízí multimodální schopnosti, ale za vyšší cenu.
Levnější (cca 1.4x vstup, 2.7x levnější výstup) Grok nabízí větší kontextové okno a nižší cenu, ale pravděpodobně nižší výkon v náročnějších úlohách.
Podobná cena vstupu, výrazně levnější výstup Ministral 14B je levnější na výstup, ale nemá multimodální schopnosti.

🎯 Rozhodovací pomocník

Použij když...

  • Analýza vědeckých dat
  • Zpracování rozsáhlých dokumentů

Nepoužívej když...

  • Vývoj aplikací vyžadujících robustní logické uvažování
  • Úkoly s vysokými nároky na programování
Ideální pro:
VýzkumníciData scientists

💪 Silné a slabé stránky

+ Silné stránky

Věda a matematika

Vynikající výsledky ve vědeckých a matematických benchmarkách, jako je GPQA Diamond (67.1%) a MATH-500 (88.9%).

Kontextové okno

Velké kontextové okno (1,048,576 tokenů) umožňuje zpracovávat rozsáhlé dokumenty a složité konverzace.

Slabé stránky

Programování

Slabší výsledky v programovacích benchmarkách (LiveCodeBench 39.7%).

Logické uvažování

Velmi nízké skóre v benchmarku HLE (4.8%) naznačuje problémy s hard logic.

📝 Detailní popis

Llama 4 Maverick 17B Instruct (128E) je velkokapacitní multimodální jazykový model od společnosti Meta, postavený na architektuře mixture-of-experts (MoE) se 128 experty a 17 miliardami aktivních parametrů na jeden průchod dopřednou sítí (celkem 400B). Podporuje multijazyčný textový a obrazový vstup a produkuje multijazyčný textový a kódový výstup ve 12 podporovaných jazycích. Maverick, optimalizovaný pro úlohy vidění a jazyka, je doladěn pomocí instrukcí pro chování podobné asistentovi, obrazové usuzování a všeobecnou multimodální interakci.

Maverick využívá ranou fúzi pro nativní multimodalitu a kontextové okno o velikosti 1 milionu tokenů. Byl trénován na kurátorské směsi veřejných, licencovaných a Meta-platform dat, pokrývající ~22 bilionů tokenů, s datovým cut-off v srpnu 2024. Maverick, vydaný 5. dubna 2025 pod licencí Llama 4 Community License, je vhodný pro výzkumné a komerční aplikace vyžadující pokročilé multimodální porozumění a vysokou propustnost modelu.

Unikátní charakteristiky

Llama 4 Maverick je multimodální model s velkým kontextovým oknem (1 milion tokenů) a architekturou MoE. Vyniká ve vědeckých úlohách (GPQA Diamond 67.1%, MATH-500 88.9%), ale má slabší výsledky v logice a programování.

Silné stránky

Věda a matematika

Vynikající výsledky ve vědeckých a matematických benchmarkách, jako je GPQA Diamond (67.1%) a MATH-500 (88.9%).

Kontextové okno

Velké kontextové okno (1,048,576 tokenů) umožňuje zpracovávat rozsáhlé dokumenty a složité konverzace.

Slabé stránky

Programování

Slabší výsledky v programovacích benchmarkách (LiveCodeBench 39.7%).

Logické uvažování

Velmi nízké skóre v benchmarku HLE (4.8%) naznačuje problémy s hard logic.

🔗 Další modely od Meta