Google: Gemini 3 Flash Preview

google/gemini-3-flash-preview

Vynikající volba pro produkční nasazení agentů, kde je kritická rovnováha mezi inteligencí, rychlostí a velikostí kontextu.

✦

Killer Feature Kombinace 1M kontextu s 'thinking' režimem v modelu s nízkou latencí.

⚠

Skryté riziko Vysoká cena výstupních tokenů ($3.00) může prodražit upovídané agenty oproti open-weight alternativám.

$0.5 / 1M vstup

$3 / 1M výstup

1.0M kontext

66k max výstup

Dobrý hodnocení

textimagefileaudiovideo text Agentní workflowNízká latenceMultimodalita

⚖️ Porovnání s konkurencí

Model	Cenové srovnání	Poznámka
Google Gemini 3 Flash Preview	← Právě prohlížíte	—
Anthropic Claude Haiku 4.5	Gemini je o 50 % levnější na vstupu a o 40 % levnější na výstupu	Gemini nabízí 5x větší kontext (1M vs 200k) a pokročilejší multimodalitu, Haiku může být stabilnější v čistě textových úlohách.
DeepSeek DeepSeek v3.2	Gemini je 2x dražší na vstupu a téměř 8x dražší na výstupu	DeepSeek vítězí v poměru cena/výkon pro čistý text/kód, Gemini dominuje v multimodalitě a velikosti kontextu (1M vs 163k).
OpenAI GPT-Audio Mini	Srovnatelná cena vstupu ($0.50 vs $0.60), Gemini má dražší výstup	Oba modely cílí na multimodalitu, ale Gemini má výrazně větší kontext (1M vs 128k) a lepší reasoning pro kódování.

🎯 Rozhodovací pomocník

✓

Použij když...

Autonomní agenti vyžadující rychlou odezvu
Analýza dlouhých videí nebo audio záznamů
RAG aplikace s velkým kontextem

✗

Nepoužívej když...

Generování obrovských objemů textu (kvůli ceně výstupu)
Extrémně levné batch zpracování (zde je lepší DeepSeek/Mistral)

Ideální pro:

Vývojáři AI agentůData analytici (velké dokumenty)Full-stack vývojáři

💪 Silné a slabé stránky

+ Silné stránky

Kontext a Caching

Kapacita 1M tokenů s automatickým cachingem kontextu výrazně snižuje náklady u opakovaných dotazů a dlouhých agentních smyček.

Reasoning/Latence

Schopnost konfigurovatelného 'myšlení' (thinking levels) v modelu třídy Flash umožňuje řešit složité úlohy rychleji než plné Pro modely.

Multimodalita

Nativní zpracování videa, audia a PDF v rámci jednoho volání bez nutnosti externích nástrojů.

− Slabé stránky

Cena výstupu

Cena $3.00 za 1M výstupních tokenů je výrazně vyšší než u konkurence jako DeepSeek ($0.38) nebo Grok ($0.50).

Specializace

Ačkoliv má 'near Pro' reasoning, pro nejnáročnější vědecké nebo matematické úlohy stále zaostává za plnými modely typu Opus nebo Gemini 3 Pro.

📝 Detailní popis

Gemini 3 Flash Preview je vysokorychlostní, vysoce hodnotný myšlenkový model navržený pro agentní pracovní postupy, vícekolové konverzace a asistenci při kódování. Poskytuje úroveň uvažování a výkonu při používání nástrojů blížící se Pro úrovni s podstatně nižší latencí než větší varianty Gemini, díky čemuž se dobře hodí pro interaktivní vývoj, dlouhotrvající agentní smyčky a kolaborativní kódovací úlohy. Ve srovnání s Gemini 2.5 Flash poskytuje široké zlepšení kvality v oblasti uvažování, multimodálního porozumění a spolehlivosti.

Model podporuje kontextové okno o velikosti 1M tokenů a multimodální vstupy včetně textu, obrázků, audia, videa a PDF, s textovým výstupem. Zahrnuje konfigurovatelné uvažování prostřednictvím úrovní myšlení (minimální, nízká, střední, vysoká), strukturovaný výstup, používání nástrojů a automatické ukládání kontextu do mezipaměti. Gemini 3 Flash Preview je optimalizován pro uživatele, kteří chtějí silné uvažování a agentní chování bez nákladů nebo latence modelů plného rozsahu.

Unikátní charakteristiky

Gemini 3 Flash Preview unikátně kombinuje ‘thinking’ (CoT) schopnosti s architekturou optimalizovanou pro rychlost, čímž překlenuje propast mezi lehkými a ‘frontier’ modely. Nabízí masivní kontextové okno s nativní podporou videa a audia při zachování nízké latence pro interaktivní agenty.

Silné stránky

Kontext a Caching

Kapacita 1M tokenů s automatickým cachingem kontextu výrazně snižuje náklady u opakovaných dotazů a dlouhých agentních smyček.

Reasoning/Latence

Schopnost konfigurovatelného ‘myšlení’ (thinking levels) v modelu třídy Flash umožňuje řešit složité úlohy rychleji než plné Pro modely.

Multimodalita