OpenAI: GPT-5 Image

openai/gpt-5-image

Prémiový model pro specifické úlohy vyžadující špičkovou synergii textu a obrazu, který je však ekonomicky nevýhodný pro čisté zpracování velkého množství textu.

✦

Killer Feature Schopnost generovat a editovat obrázky s přesným renderováním textu v rámci logického toku GPT-5.

⚠

Skryté riziko Vysoká cena vstupních tokenů ($10/1M) může extrémně prodražit práci s dlouhou historií konverzace.

$10 / 1M vstup

$10 / 1M výstup

400k kontext

128k max výstup

Dobrý hodnocení

imagetextfile imagetext Generování obrázkůKomplexní usuzováníMultimodální instrukce

⚖️ Porovnání s konkurencí

Model	Cenové srovnání	Poznámka
Openai GPT-5 Image	← Právě prohlížíte	—
Google Gemini 3 Pro Image Preview	Vstup 5x levnější, výstup o 20 % dražší	Gemini je výrazně levnější na čtení dat, ale má kriticky malé kontextové okno (65k) oproti GPT-5 Image (400k).
Anthropic Claude Opus 4.5	Vstup 2x levnější, výstup 2.5x dražší	Opus je silný v logice, ale GPT-5 Image nabízí nativní generování obrázků a levnější generování dlouhého textu.
Anthropic Claude Sonnet 4.5	Výrazně levnější (cca 30 % ceny GPT-5)	Sonnet nabízí 2.5x větší kontext (1M) a lepší poměr cena/výkon pro čistě textové úlohy.

🎯 Rozhodovací pomocník

✓

Použij když...

Generování ilustrovaných technických manuálů
Vytváření UI mockupů s kódem
Komplexní vizuální storytelling

✗

Nepoužívej když...

Analýza velkých objemů textových dat (drahý vstup)
Jednoduché chatboty (zbytečně výkonný a drahý)

Ideální pro:

Kreativní profesionálovéVývojáři front-enduMarketingové týmy

💪 Silné a slabé stránky

+ Silné stránky

Multimodalita

Schopnost generovat text i obrázky v rámci jedné odpovědi s kontextem 400 000 tokenů, což překonává specializované modely s menším oknem.

Výstupní kapacita

Max output 128 000 tokenů umožňuje generovat rozsáhlé dokumenty nebo kódové báze spolu s vizuálními prvky v jednom průchodu.

Instrukce

Vylepšené dodržování složitých promptů pro úpravu obrázků a renderování textu uvnitř grafiky (dědictví GPT Image 1).

− Slabé stránky

Cena vstupu

Cena $10.00 za 1M vstupních tokenů je 5x vyšší než u Google Gemini 3 Pro ($2.00) a 2x vyšší než u Claude Opus 4.5 ($5.00), což prodražuje RAG aplikace.

Kontextové okno

Ačkoliv je 400k slušné, zaostává za standardem 1M+ tokenů, který nabízí konkurence (Claude Sonnet 4.5, Gemini 3 Flash/Pro).

📝 Detailní popis

GPT-5 Image kombinuje model GPT-5 od OpenAI s nejmodernějšími schopnostmi generování obrazu. Nabízí zásadní vylepšení v usuzování, kvalitě kódu a uživatelské zkušenosti a zároveň zahrnuje vynikající dodržování instrukcí, vykreslování textu a detailní úpravy obrazu modelu GPT Image 1.

Unikátní charakteristiky

Model integruje schopnosti uvažování GPT-5 s nativním generováním obrázků v jednom procesu, což eliminuje potřebu externích nástrojů (DALL-E). Vyznačuje se symetrickou cenovou politikou pro vstup a výstup a vysokým limitem pro generování tokenů.

Silné stránky

Multimodalita