G
Google 17. 12. 2025
82 skóre

Google: Gemini 3 Flash Preview

google/gemini-3-flash-preview

Vynikající volba pro produkční nasazení agentů, kde je kritická rovnováha mezi inteligencí, rychlostí a velikostí kontextu.

Killer Feature Kombinace 1M kontextu s 'thinking' režimem v modelu s nízkou latencí.
Skryté riziko Vysoká cena výstupních tokenů ($3.00) může prodražit upovídané agenty oproti open-weight alternativám.
$0.5 / 1M vstup
$3 / 1M výstup
1.0M kontext
66k max výstup
Dobrý hodnocení
textimagefileaudiovideo text Agentní workflowNízká latenceMultimodalita

📊 Benchmarky

🧠 Reasoning
80
Dobrý
👁️ Multimodalita
90
Výborný
📏 Kontextové okno
92
Výborný
Rychlost
85
Výborný
💰 Cena/Výkon
65
Průměrný
Celkové skóre 82/100

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Google Gemini 3 Flash Preview
← Právě prohlížíte
Anthropic Claude Haiku 4.5
Gemini je o 50 % levnější na vstupu a o 40 % levnější na výstupu Gemini nabízí 5x větší kontext (1M vs 200k) a pokročilejší multimodalitu, Haiku může být stabilnější v čistě textových úlohách.
DeepSeek DeepSeek v3.2
Gemini je 2x dražší na vstupu a téměř 8x dražší na výstupu DeepSeek vítězí v poměru cena/výkon pro čistý text/kód, Gemini dominuje v multimodalitě a velikosti kontextu (1M vs 163k).
Srovnatelná cena vstupu ($0.50 vs $0.60), Gemini má dražší výstup Oba modely cílí na multimodalitu, ale Gemini má výrazně větší kontext (1M vs 128k) a lepší reasoning pro kódování.

🎯 Rozhodovací pomocník

Použij když...

  • Autonomní agenti vyžadující rychlou odezvu
  • Analýza dlouhých videí nebo audio záznamů
  • RAG aplikace s velkým kontextem

Nepoužívej když...

  • Generování obrovských objemů textu (kvůli ceně výstupu)
  • Extrémně levné batch zpracování (zde je lepší DeepSeek/Mistral)
Ideální pro:
Vývojáři AI agentůData analytici (velké dokumenty)Full-stack vývojáři

💪 Silné a slabé stránky

+ Silné stránky

Kontext a Caching

Kapacita 1M tokenů s automatickým cachingem kontextu výrazně snižuje náklady u opakovaných dotazů a dlouhých agentních smyček.

Reasoning/Latence

Schopnost konfigurovatelného 'myšlení' (thinking levels) v modelu třídy Flash umožňuje řešit složité úlohy rychleji než plné Pro modely.

Multimodalita

Nativní zpracování videa, audia a PDF v rámci jednoho volání bez nutnosti externích nástrojů.

Slabé stránky

Cena výstupu

Cena $3.00 za 1M výstupních tokenů je výrazně vyšší než u konkurence jako DeepSeek ($0.38) nebo Grok ($0.50).

Specializace

Ačkoliv má 'near Pro' reasoning, pro nejnáročnější vědecké nebo matematické úlohy stále zaostává za plnými modely typu Opus nebo Gemini 3 Pro.

📝 Detailní popis

Gemini 3 Flash Preview je vysokorychlostní, vysoce hodnotný myšlenkový model navržený pro agentní pracovní postupy, vícekolové konverzace a asistenci při kódování. Poskytuje úroveň uvažování a výkonu při používání nástrojů blížící se Pro úrovni s podstatně nižší latencí než větší varianty Gemini, díky čemuž se dobře hodí pro interaktivní vývoj, dlouhotrvající agentní smyčky a kolaborativní kódovací úlohy. Ve srovnání s Gemini 2.5 Flash poskytuje široké zlepšení kvality v oblasti uvažování, multimodálního porozumění a spolehlivosti.

Model podporuje kontextové okno o velikosti 1M tokenů a multimodální vstupy včetně textu, obrázků, audia, videa a PDF, s textovým výstupem. Zahrnuje konfigurovatelné uvažování prostřednictvím úrovní myšlení (minimální, nízká, střední, vysoká), strukturovaný výstup, používání nástrojů a automatické ukládání kontextu do mezipaměti. Gemini 3 Flash Preview je optimalizován pro uživatele, kteří chtějí silné uvažování a agentní chování bez nákladů nebo latence modelů plného rozsahu.

Unikátní charakteristiky

Gemini 3 Flash Preview unikátně kombinuje ‘thinking’ (CoT) schopnosti s architekturou optimalizovanou pro rychlost, čímž překlenuje propast mezi lehkými a ‘frontier’ modely. Nabízí masivní kontextové okno s nativní podporou videa a audia při zachování nízké latence pro interaktivní agenty.

Silné stránky

Kontext a Caching

Kapacita 1M tokenů s automatickým cachingem kontextu výrazně snižuje náklady u opakovaných dotazů a dlouhých agentních smyček.

Reasoning/Latence

Schopnost konfigurovatelného ‘myšlení’ (thinking levels) v modelu třídy Flash umožňuje řešit složité úlohy rychleji než plné Pro modely.

Multimodalita

Nativní zpracování videa, audia a PDF v rámci jednoho volání bez nutnosti externích nástrojů.

Slabé stránky

Cena výstupu

Cena $3.00 za 1M výstupních tokenů je výrazně vyšší než u konkurence jako DeepSeek ($0.38) nebo Grok ($0.50).

Specializace

Ačkoliv má ‘near Pro’ reasoning, pro nejnáročnější vědecké nebo matematické úlohy stále zaostává za plnými modely typu Opus nebo Gemini 3 Pro.

🔗 Další modely od Google