GPT-5 Image kombinuje model GPT-5 od OpenAI s nejmodernějšími schopnostmi generování obrazu. Nabízí zásadní vylepšení v usuzování, kvalitě kódu a uživatelské zkušenosti a zároveň zahrnuje vynikající dodržování instrukcí, vykreslování textu a detailní úpravy obrazu modelu GPT Image 1.
Unikátní charakteristiky
Model integruje schopnosti uvažování GPT-5 s nativním generováním obrázků v jednom procesu, což eliminuje potřebu externích nástrojů (DALL-E). Vyznačuje se symetrickou cenovou politikou pro vstup a výstup a vysokým limitem pro generování tokenů.
Silné stránky
Multimodalita
Schopnost generovat text i obrázky v rámci jedné odpovědi s kontextem 400 000 tokenů, což překonává specializované modely s menším oknem.
Výstupní kapacita
Max output 128 000 tokenů umožňuje generovat rozsáhlé dokumenty nebo kódové báze spolu s vizuálními prvky v jednom průchodu.
Instrukce
Vylepšené dodržování složitých promptů pro úpravu obrázků a renderování textu uvnitř grafiky (dědictví GPT Image 1).
Slabé stránky
Cena vstupu
Cena $10.00 za 1M vstupních tokenů je 5x vyšší než u Google Gemini 3 Pro ($2.00) a 2x vyšší než u Claude Opus 4.5 ($5.00), což prodražuje RAG aplikace.
Kontextové okno
Ačkoliv je 400k slušné, zaostává za standardem 1M+ tokenů, který nabízí konkurence (Claude Sonnet 4.5, Gemini 3 Flash/Pro).