Llama 4 Scout 17B Instruct (16E) je jazykový model typu mixture-of-experts (MoE) vyvinutý společností Meta, který aktivuje 17 miliard parametrů z celkového počtu 109 miliard. Podporuje nativní multimodální vstup (text a obrázek) a multijazyčný výstup (text a kód) ve 12 podporovaných jazycích. Scout, navržený pro interakci ve stylu asistenta a vizuální usuzování, používá 16 expertů na jeden forward pass a disponuje kontextovou délkou 10 milionů tokenů, s trénovacím korpusem o velikosti ~40 bilionů tokenů.
Llama 4 Scout, vytvořený pro vysokou efektivitu a lokální nebo komerční nasazení, zahrnuje early fusion pro bezproblémovou integraci modalit. Je instruction-tuned pro použití v multijazyčném chatu, vytváření titulků a úlohách porozumění obrázkům. Byl vydán pod licencí Llama 4 Community License, naposledy trénován na datech do srpna 2024 a veřejně spuštěn 5. dubna 2025.
Unikátní charakteristiky
Llama 4 Scout je navržen pro vysokou efektivitu a lokální nasazení, integruje multimodální vstupy pomocí early fusion a je optimalizován pro interakci ve stylu asistenta. Využívá 16 expertů na průchod a má kontextovou délku 327 680 tokenů.
Silné stránky
Kontext
Velký kontext 327 680 tokenů umožňuje zpracování rozsáhlých dokumentů a komplexních úloh.
Multimodalita
Podporuje nativní multimodální vstup (text a obraz), což rozšiřuje možnosti využití.
Slabé stránky
Programování
S nízkým skóre 29.9 na LiveCodeBench je model slabý v programovacích úlohách.
Čeština
Data pro češtinu nejsou k dispozici, což omezuje jeho použitelnost v českém prostředí.