Gemini 2.5 Flash Image, známý také jako “Nano Banana,” je nyní obecně dostupný. Jedná se o nejmodernější model pro generování obrázků s kontextuálním porozuměním. Je schopen generovat obrázky, provádět úpravy a vést vícekolové konverzace. Poměry stran lze ovládat pomocí parametru API image_config
Unikátní charakteristiky
Gemini 2.5 Flash Image, kódově označený ‘Nano Banana’, je specializovaný model optimalizovaný pro nízkou latenci a efektivní generování vizuálního obsahu. Na rozdíl od standardních LLM integruje schopnost generovat a upravovat obrázky přímo v rámci konverzačního toku.
Silné stránky
Multimodální generace
Nativní podpora pro generování a editaci obrázků (text-to-image, image-to-image) v rámci multi-turn konverzací.
Cena vstupu
Extrémně nízká cena za vstupní tokeny ($0.30/1M) umožňuje zpracovávat složité prompty a historii chatu s minimálními náklady.
Rychlost
Jako model třídy ‘Flash’ nabízí výrazně nižší latenci při generování než ‘Pro’ varianty, což je klíčové pro interaktivní aplikace.
Slabé stránky
Kontextové okno
Kapacita 32,768 tokenů je v kontextu konkurence z prosince 2025 (běžně 200k-1M+) výrazně podprůměrná a limituje dlouhé konverzace.
Disproporce cen
Cena výstupu ($2.50/1M) je více než 8x vyšší než cena vstupu, což odráží výpočetní náročnost generování obrazových dat.