Google: Gemini 3.1 Flash Lite Preview

google/gemini-3.1-flash-lite-preview

Vynikající volba pro 'heavy-input' scénáře, kde potřebujete zpracovat obrovské množství textu, audia či videa za minimální náklady, ale výstup je stručný.

✦

Killer Feature Kombinace 1M kontextového okna s cenou $0.25/1M tokenů a nativním zpracováním videa.

⚠

Skryté riziko Nepoměr mezi cenou vstupu a výstupu ($1.50) může nečekaně prodražit aplikace, které generují obsáhlé odpovědi.

$0.25 / 1M vstup

$1.5 / 1M výstup

1.0M kontext

66k max výstup

Dobrý hodnocení

textimagevideofileaudio text Vysoká efektivitaMultimodální zpracováníDlouhý kontext

⚖️ Porovnání s konkurencí

Model	Cenové srovnání	Poznámka
Google Gemini 3.1 Flash Lite Preview	← Právě prohlížíte	—
X-AI Grok-4.1-fast	Grok je levnější ($0.20 vs $0.25 vstup, $0.50 vs $1.50 výstup)	Grok nabízí dvojnásobný kontext (2M) a levnější výstup, ale Gemini vede v nativní podpoře audia/videa a integraci nástrojů.
DeepSeek DeepSeek-v3.2	Stejný vstup ($0.25), ale DeepSeek má výrazně levnější výstup ($0.40)	DeepSeek je efektivnější pro generování textu, ale má výrazně menší kontext (163k vs 1M) než Gemini.
MistralAI Ministral-14b-2512	Mistral je levnější na vstupu i výstupu ($0.20/$0.20)	Mistral je vhodnější pro edge/lokální nasazení a jednoduché chaty, Gemini dominuje v úlohách vyžadujících velký kontext.

🎯 Rozhodovací pomocník

✓

Použij když...

Analýza a extrakce dat z dlouhých dokumentů či videí
Hromadný překlad a klasifikace textu
Přepis a sumarizace audia ve velkém měřítku

✗

Nepoužívej když...

Kreativní psaní vyžadující vysokou stylistickou úroveň
Generování extrémně dlouhých textových výstupů (kvůli ceně výstupu)

Ideální pro:

Vývojáři RAG aplikacíAnalytici multimediálního obsahuStartupy zaměřené na zpracování dat

💪 Silné a slabé stránky

+ Silné stránky

Kontext a Multimodalita

Kombinace 1 milionu tokenů kontextu a nativního zpracování audia/videa je v cenové hladině $0.25 za vstup bezkonkurenční.

Flexibilita inference

Podpora 'thinking levels' (minimal až high) umožňuje modelu zvládat i složitější úlohy, které byly dříve doménou pouze 'Pro' modelů.

Cena vstupu

Cena $0.25/1M tokenů na vstupu je extrémně kompetitivní pro RAG aplikace s velkým objemem dat.

− Slabé stránky

Cena výstupu

Cena $1.50 za 1M výstupních tokenů je 3x až 4x vyšší než u přímé konkurence (DeepSeek, Grok), což prodražuje generování dlouhých textů.

Absolutní výkon

Jako 'Lite' model stále nedosahuje kvalit Gemini 3.1 Pro nebo Claude Opus v komplexním logickém uvažování a nuancích.

📝 Detailní popis

Gemini 3.1 Flash Lite Preview je vysoce efektivní model od Googlu, optimalizovaný pro případy použití s vysokým objemem. Překonává Gemini 2.5 Flash Lite v celkové kvalitě a v klíčových schopnostech se blíží výkonu Gemini 2.5 Flash. Vylepšení zahrnují audio vstup/ASR, řazení úryvků RAG, překlad, extrakci dat a dokončování kódu. Podporuje plné úrovně myšlení (minimální, nízká, střední, vysoká) pro jemné doladění kompromisů mezi cenou a výkonem. Je naceněn na polovinu ceny Gemini 3 Flash.

Unikátní charakteristiky

Gemini 3.1 Flash Lite Preview přináší masivní kontextové okno (1M tokenů) do segmentu nízkonákladových modelů. Technicky se odlišuje podporou nastavitelných úrovní ‘myšlení’ (thinking levels) i v této odlehčené třídě, což umožňuje dynamicky řídit poměr mezi cenou a kvalitou uvažování.

Silné stránky

Kontext a Multimodalita

Kombinace 1 milionu tokenů kontextu a nativního zpracování audia/videa je v cenové hladině $0.25 za vstup bezkonkurenční.

Flexibilita inference

Podpora ‘thinking levels’ (minimal až high) umožňuje modelu zvládat i složitější úlohy, které byly dříve doménou pouze ‘Pro’ modelů.

Cena vstupu