G
Google 20. 11. 2025
82 skóre

Google: Nano Banana Pro (Gemini 3 Pro Image Preview)

google/gemini-3-pro-image-preview

Špičkový nástroj pro profesionální kreativce vyžadující precizní kontrolu nad textem a kompozicí v obraze, který obětuje velikost kontextu ve prospěch vizuální kvality.

Killer Feature Schopnost přesného renderingu dlouhých textových pasáží a vícejazyčných layoutů přímo v obraze.
Skryté riziko Relativně malé kontextové okno (65k) může být limitující při snaze o udržení kontinuity v rámci velmi dlouhých projektů.
$2 / 1M vstup
$12 / 1M výstup
66k kontext
33k max výstup
Dobrý hodnocení
imagetext imagetext Generování a editace obrazuMultimodální reasoning

📊 Benchmarky

👁️ Multimodalita (Obraz)
96
Výborný
🧠 Reasoning
88
Výborný
🎨 Kreativita
94
Výborný
📏 Kontextové okno
55
Průměrný
💰 Cena/Výkon
70
Dobrý
Celkové skóre 82/100

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Google Nano Banana Pro (Gemini 3 Pro Image Preview)
← Právě prohlížíte
Stejná cena vstupu/výstupu ($2/$12) Standardní verze nabízí masivní 1M kontext, ale postrádá specializované 'Nano Banana' nástroje pro jemnou editaci obrazu a 4K výstup.
Anthropic Claude Sonnet 4.5
Dražší vstup ($3 vs $2) i výstup ($15 vs $12) Sonnet 4.5 dominuje v textovém reasoningu a má 15x větší kontext, ale nedosahuje kvalit Nano Banana Pro v přímém generování a manipulaci vizuálů.
Výrazně levnější (cca 6.5x na vstupu, 4.8x na výstupu) Flash Image je ekonomická volba pro jednoduché vizuály; Nano Banana Pro je nutný upgrade pro konzistentní postavy a složitou typografii.

🎯 Rozhodovací pomocník

Použij když...

  • Tvorba infografiky s přesným textem
  • Konzistentní vizualizace produktů v různých scénách
  • Filmové koncepty s udržením identity postav

Nepoužívej když...

  • Analýza extrémně dlouhých textových dokumentů (nad 65k tokenů)
  • Hromadné generování levných náhledových obrázků
Ideální pro:
Grafičtí designéřiMarketingové týmyTvůrci storyboardů

💪 Silné a slabé stránky

+ Silné stránky

Vykreslování textu

Schopnost bezchybně integrovat dlouhé textové pasáže a vícejazyčné layouty přímo do generované grafiky, což překonává standardní difuzní modely.

Konzistence a kontrola

Zachování identity až u pěti subjektů a podpora lokalizovaných úprav (osvětlení, fokus) umožňuje profesionální storyboarding a produktovou vizualizaci.

Slabé stránky

Kontextové okno

Kapacita 65,536 tokenů je výrazně nižší než u standardního Gemini 3 Pro (1M+) nebo konkurence od Anthropic, což omezuje práci s rozsáhlými dokumenty před generováním.

Cena výstupu

Cena $12.00 za 1M výstupních tokenů je vysoká, zejména při generování sérií obrázků ve vysokém rozlišení.

📝 Detailní popis

Nano Banana Pro je nejpokročilejší model pro generování a úpravu obrázků od Googlu, postavený na Gemini 3 Pro. Rozšiřuje původní Nano Banana o výrazně vylepšené multimodální usuzování, ukotvení v reálném světě a vizuální syntézu s vysokou věrností. Model generuje grafiku bohatou na kontext, od infografik a diagramů po filmové kompozice, a dokáže začlenit informace v reálném čase prostřednictvím Search grounding.

Nabízí špičkové vykreslování textu v obrázcích (včetně dlouhých pasáží a vícejazyčných rozvržení), konzistentní prolínání více obrázků a přesnou zachování identity až u pěti subjektů. Nano Banana Pro přidává jemně odstupňované kreativní ovládací prvky, jako jsou lokalizované úpravy, úpravy osvětlení a zaostření, transformace kamery a podpora výstupů 2K/4K a flexibilních poměrů stran. Je navržen pro profesionální design, vizualizaci produktů, tvorbu storyboardů a komplexní kompozice s více prvky, přičemž zůstává efektivní pro obecné pracovní postupy tvorby obrázků.

Unikátní charakteristiky

Nano Banana Pro je specializovaná varianta modelu Gemini 3 Pro zaměřená na vizuální syntézu s vysokou věrností a přesné vykreslování textu v grafice. Model kombinuje pokročilé jazykové chápání s granulární kontrolou nad generováním obrazu, včetně zachování identity subjektů a podpory 4K rozlišení.

Silné stránky

Vykreslování textu

Schopnost bezchybně integrovat dlouhé textové pasáže a vícejazyčné layouty přímo do generované grafiky, což překonává standardní difuzní modely.

Konzistence a kontrola

Zachování identity až u pěti subjektů a podpora lokalizovaných úprav (osvětlení, fokus) umožňuje profesionální storyboarding a produktovou vizualizaci.

Slabé stránky

Kontextové okno

Kapacita 65,536 tokenů je výrazně nižší než u standardního Gemini 3 Pro (1M+) nebo konkurence od Anthropic, což omezuje práci s rozsáhlými dokumenty před generováním.

Cena výstupu

Cena $12.00 za 1M výstupních tokenů je vysoká, zejména při generování sérií obrázků ve vysokém rozlišení.

🔗 Další modely od Google