Gemini 2.5 Flash-Lite je odlehčený model pro usuzování z rodiny Gemini 2.5, optimalizovaný pro ultra-nízkou latenci a nákladovou efektivitu. Nabízí vylepšenou propustnost, rychlejší generování tokenů a lepší výkon v běžných benchmarkách ve srovnání s dřívějšími modely Flash. Ve výchozím nastavení je “myšlení” (tj. víceprůchodové usuzování) deaktivováno, aby se upřednostnila rychlost, ale vývojáři jej mohou povolit prostřednictvím parametru Reasoning API a selektivně tak vyměnit náklady za inteligenci.
Unikátní charakteristiky
Gemini 2.5 Flash-Lite je optimalizovaný model zaměřený na extrémní rychlost a nízké náklady, který si zachovává masivní kontextové okno 1 milionu tokenů. Unikátní je možnost volitelného zapnutí ‘thinking’ procesu přes API, což umožňuje dynamicky měnit model z rychlého procesoru na schopnější reasoning engine podle potřeby.
Silné stránky
Cenová efektivita
S cenou $0.10 za 1M vstupních tokenů patří mezi nejlevnější modely na trhu, přičemž nabízí kontext, který je u konkurence v této cenové hladině vzácný.
Multimodalita a Kontext
Kombinace 1M kontextového okna s nativním zpracováním videa a audia umožňuje levnou analýzu velkých objemů multimediálních dat.
Flexibilita Reasoningu
Možnost aktivovat ‘thinking’ (multi-pass reasoning) pouze pro složité dotazy šetří náklady u jednoduchých úloh.
Slabé stránky
Hloubka znalostí
Jako ‘Lite’ verze má pravděpodobně nižší kapacitu pro uložení faktických znalostí ve srovnání s modely řady Pro nebo Ultra.
Omezení výstupu
Maximální výstup 65,535 tokenů je sice velkorysý, ale pro generování extrémně dlouhých textů v jednom průchodu může být limitující oproti plnému kontextu.