Nano Banana Pro je nejpokročilejší model pro generování a úpravu obrázků od Googlu, postavený na Gemini 3 Pro. Rozšiřuje původní Nano Banana o výrazně vylepšené multimodální usuzování, ukotvení v reálném světě a vizuální syntézu s vysokou věrností. Model generuje grafiku bohatou na kontext, od infografik a diagramů po filmové kompozice, a dokáže začlenit informace v reálném čase prostřednictvím Search grounding.
Nabízí špičkové vykreslování textu v obrázcích (včetně dlouhých pasáží a vícejazyčných rozvržení), konzistentní prolínání více obrázků a přesnou zachování identity až u pěti subjektů. Nano Banana Pro přidává jemně odstupňované kreativní ovládací prvky, jako jsou lokalizované úpravy, úpravy osvětlení a zaostření, transformace kamery a podpora výstupů 2K/4K a flexibilních poměrů stran. Je navržen pro profesionální design, vizualizaci produktů, tvorbu storyboardů a komplexní kompozice s více prvky, přičemž zůstává efektivní pro obecné pracovní postupy tvorby obrázků.
Unikátní charakteristiky
Nano Banana Pro je specializovaná varianta modelu Gemini 3 Pro zaměřená na vizuální syntézu s vysokou věrností a přesné vykreslování textu v grafice. Model kombinuje pokročilé jazykové chápání s granulární kontrolou nad generováním obrazu, včetně zachování identity subjektů a podpory 4K rozlišení.
Silné stránky
Vykreslování textu
Schopnost bezchybně integrovat dlouhé textové pasáže a vícejazyčné layouty přímo do generované grafiky, což překonává standardní difuzní modely.
Konzistence a kontrola
Zachování identity až u pěti subjektů a podpora lokalizovaných úprav (osvětlení, fokus) umožňuje profesionální storyboarding a produktovou vizualizaci.
Slabé stránky
Kontextové okno
Kapacita 65,536 tokenů je výrazně nižší než u standardního Gemini 3 Pro (1M+) nebo konkurence od Anthropic, což omezuje práci s rozsáhlými dokumenty před generováním.
Cena výstupu
Cena $12.00 za 1M výstupních tokenů je vysoká, zejména při generování sérií obrázků ve vysokém rozlišení.