LiquidAI: LFM2-24B-A2B

liquid/lfm-2-24b-a2b

Bezkonkurenční volba pro scénáře citlivé na cenu a latenci, kde není vyžadován obří kontext.

✦

Killer Feature Poměr aktivních parametrů (2B) k celkové kapacitě (24B) přináší kvalitu středního modelu za cenu malého modelu.

⚠

Skryté riziko Velmi malé kontextové okno (32k) může být v roce 2025 pro mnoho RAG aplikací kritickým úzkým hrdlem.

$0.03 / 1M vstup

$0.12 / 1M výstup

33k kontext

Dobrý hodnocení

text text Edge computingEfektivita inferenceLokální nasazení

⚖️ Porovnání s konkurencí

Model	Cenové srovnání	Poznámka
Liquid LFM2-24B-A2B	← Právě prohlížíte	—
MistralAI mistral-small-creative	Liquid je cca 3x levnější na vstupu a 2.5x na výstupu	Oba modely mají stejný kontext (32k), ale Liquid cílí agresivněji na poměr cena/výkon a efektivitu.
MistralAI ministral-14b-2512	Liquid je 6x levnější na vstupu, výstup je levnější o 40%	Ministral nabízí výrazně větší kontext (262k), ale Liquid vítězí v provozních nákladech pro krátké úlohy.
DeepSeek deepseek-v3.2	Liquid je více než 8x levnější na vstupu	DeepSeek je vyšší třída s lepším reasoningem a kontextem, Liquid je volbou pro masivní škálování jednoduchých úloh.

🎯 Rozhodovací pomocník

✓

Použij když...

Rychlá klasifikace textu a extrakce dat
Lokální asistenti na laptopech
Real-time sumarizace krátkých textů

✗

Nepoužívej když...

Analýza celých knih nebo dlouhých reportů (limit 32k)
Komplexní vědecký výzkum vyžadující hluboký reasoning

Ideální pro:

Vývojáři on-device aplikacíFirmy zpracovávající masivní objemy datStartupy s omezeným rozpočtem na inferenci

💪 Silné a slabé stránky

+ Silné stránky

Cenová efektivita

S cenou $0.03 za 1M vstupních tokenů je model 3-8x levnější než nejbližší konkurence v seznamu (Mistral Small, Grok Fast).

Hardwarová nenáročnost

Díky 2B aktivním parametrům a optimalizaci paměti (32 GB RAM) umožňuje lokální nasazení tam, kde konkurence vyžaduje cloud.

− Slabé stránky

Kontextové okno

Kapacita 32,768 tokenů je v kontextu roku 2025 (kde standardem je 200k-1M) výrazně podprůměrná a limituje práci s velkými dokumenty.

Komplexní reasoning

Ačkoliv má model 24B parametrů, aktivní část (2B) může limitovat schopnost řešit vysoce abstraktní nebo víceúrovňové logické úlohy ve srovnání s 'hustými' modely.

📝 Detailní popis

LFM2-24B-A2B je největší model v rodině LFM2 hybridních architektur navržených pro efektivní nasazení přímo na zařízení. Je postaven jako 24B parametrový model Mixture-of-Experts s pouze 2B aktivními parametry na token a poskytuje vysoce kvalitní generování při zachování nízkých nákladů na inferenci. Model se vejde do 32 GB RAM, což umožňuje jeho praktické spouštění na spotřebitelských laptopech a stolních počítačích bez obětování schopností.

Unikátní charakteristiky

LFM2-24B-A2B využívá hybridní architekturu s mechanismem Mixture-of-Experts, která aktivuje pouze 2 miliardy parametrů na token, což umožňuje extrémně rychlou inferenci. Model je specificky navržen tak, aby se vešel do 32 GB RAM, což jej činí ideálním pro běh na spotřebitelském hardwaru bez nutnosti serverových GPU klastrů.

Silné stránky

Cenová efektivita