LFM2-24B-A2B je největší model v rodině LFM2 hybridních architektur navržených pro efektivní nasazení přímo na zařízení. Je postaven jako 24B parametrový model Mixture-of-Experts s pouze 2B aktivními parametry na token a poskytuje vysoce kvalitní generování při zachování nízkých nákladů na inferenci. Model se vejde do 32 GB RAM, což umožňuje jeho praktické spouštění na spotřebitelských laptopech a stolních počítačích bez obětování schopností.
Unikátní charakteristiky
LFM2-24B-A2B využívá hybridní architekturu s mechanismem Mixture-of-Experts, která aktivuje pouze 2 miliardy parametrů na token, což umožňuje extrémně rychlou inferenci. Model je specificky navržen tak, aby se vešel do 32 GB RAM, což jej činí ideálním pro běh na spotřebitelském hardwaru bez nutnosti serverových GPU klastrů.
Silné stránky
Cenová efektivita
S cenou $0.03 za 1M vstupních tokenů je model 3-8x levnější než nejbližší konkurence v seznamu (Mistral Small, Grok Fast).
Hardwarová nenáročnost
Díky 2B aktivním parametrům a optimalizaci paměti (32 GB RAM) umožňuje lokální nasazení tam, kde konkurence vyžaduje cloud.
Slabé stránky
Kontextové okno
Kapacita 32,768 tokenů je v kontextu roku 2025 (kde standardem je 200k-1M) výrazně podprůměrná a limituje práci s velkými dokumenty.
Komplexní reasoning
Ačkoliv má model 24B parametrů, aktivní část (2B) může limitovat schopnost řešit vysoce abstraktní nebo víceúrovňové logické úlohy ve srovnání s ‘hustými’ modely.