Gemini 3.1 Flash Lite Preview je vysoce efektivní model od Googlu, optimalizovaný pro případy použití s vysokým objemem. Překonává Gemini 2.5 Flash Lite v celkové kvalitě a v klíčových schopnostech se blíží výkonu Gemini 2.5 Flash. Vylepšení zahrnují audio vstup/ASR, řazení úryvků RAG, překlad, extrakci dat a dokončování kódu. Podporuje plné úrovně myšlení (minimální, nízká, střední, vysoká) pro jemné doladění kompromisů mezi cenou a výkonem. Je naceněn na polovinu ceny Gemini 3 Flash.
Unikátní charakteristiky
Gemini 3.1 Flash Lite Preview přináší masivní kontextové okno (1M tokenů) do segmentu nízkonákladových modelů. Technicky se odlišuje podporou nastavitelných úrovní ‘myšlení’ (thinking levels) i v této odlehčené třídě, což umožňuje dynamicky řídit poměr mezi cenou a kvalitou uvažování.
Silné stránky
Kontext a Multimodalita
Kombinace 1 milionu tokenů kontextu a nativního zpracování audia/videa je v cenové hladině $0.25 za vstup bezkonkurenční.
Flexibilita inference
Podpora ‘thinking levels’ (minimal až high) umožňuje modelu zvládat i složitější úlohy, které byly dříve doménou pouze ‘Pro’ modelů.
Cena vstupu
Cena $0.25/1M tokenů na vstupu je extrémně kompetitivní pro RAG aplikace s velkým objemem dat.
Slabé stránky
Cena výstupu
Cena $1.50 za 1M výstupních tokenů je 3x až 4x vyšší než u přímé konkurence (DeepSeek, Grok), což prodražuje generování dlouhých textů.
Absolutní výkon
Jako ‘Lite’ model stále nedosahuje kvalit Gemini 3.1 Pro nebo Claude Opus v komplexním logickém uvažování a nuancích.