O
Openai 14. 10. 2025
82 skóre

OpenAI: GPT-5 Image

openai/gpt-5-image

Prémiový model pro specifické úlohy vyžadující špičkovou synergii textu a obrazu, který je však ekonomicky nevýhodný pro čisté zpracování velkého množství textu.

Killer Feature Schopnost generovat a editovat obrázky s přesným renderováním textu v rámci logického toku GPT-5.
Skryté riziko Vysoká cena vstupních tokenů ($10/1M) může extrémně prodražit práci s dlouhou historií konverzace.
$10 / 1M vstup
$10 / 1M výstup
400k kontext
128k max výstup
Dobrý hodnocení
imagetextfile imagetext Generování obrázkůKomplexní usuzováníMultimodální instrukce

📊 Benchmarky

👁️ Multimodalita
95
Výborný
🧠 Reasoning
92
Výborný
💻 Programování
88
Výborný
📏 Kontextové okno
75
Dobrý
💰 Cena/Výkon
60
Průměrný
Celkové skóre 82/100

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Openai GPT-5 Image
← Právě prohlížíte
Vstup 5x levnější, výstup o 20 % dražší Gemini je výrazně levnější na čtení dat, ale má kriticky malé kontextové okno (65k) oproti GPT-5 Image (400k).
Anthropic Claude Opus 4.5
Vstup 2x levnější, výstup 2.5x dražší Opus je silný v logice, ale GPT-5 Image nabízí nativní generování obrázků a levnější generování dlouhého textu.
Anthropic Claude Sonnet 4.5
Výrazně levnější (cca 30 % ceny GPT-5) Sonnet nabízí 2.5x větší kontext (1M) a lepší poměr cena/výkon pro čistě textové úlohy.

🎯 Rozhodovací pomocník

Použij když...

  • Generování ilustrovaných technických manuálů
  • Vytváření UI mockupů s kódem
  • Komplexní vizuální storytelling

Nepoužívej když...

  • Analýza velkých objemů textových dat (drahý vstup)
  • Jednoduché chatboty (zbytečně výkonný a drahý)
Ideální pro:
Kreativní profesionálovéVývojáři front-enduMarketingové týmy

💪 Silné a slabé stránky

+ Silné stránky

Multimodalita

Schopnost generovat text i obrázky v rámci jedné odpovědi s kontextem 400 000 tokenů, což překonává specializované modely s menším oknem.

Výstupní kapacita

Max output 128 000 tokenů umožňuje generovat rozsáhlé dokumenty nebo kódové báze spolu s vizuálními prvky v jednom průchodu.

Instrukce

Vylepšené dodržování složitých promptů pro úpravu obrázků a renderování textu uvnitř grafiky (dědictví GPT Image 1).

Slabé stránky

Cena vstupu

Cena $10.00 za 1M vstupních tokenů je 5x vyšší než u Google Gemini 3 Pro ($2.00) a 2x vyšší než u Claude Opus 4.5 ($5.00), což prodražuje RAG aplikace.

Kontextové okno

Ačkoliv je 400k slušné, zaostává za standardem 1M+ tokenů, který nabízí konkurence (Claude Sonnet 4.5, Gemini 3 Flash/Pro).

📝 Detailní popis

GPT-5 Image kombinuje model GPT-5 od OpenAI s nejmodernějšími schopnostmi generování obrazu. Nabízí zásadní vylepšení v usuzování, kvalitě kódu a uživatelské zkušenosti a zároveň zahrnuje vynikající dodržování instrukcí, vykreslování textu a detailní úpravy obrazu modelu GPT Image 1.

Unikátní charakteristiky

Model integruje schopnosti uvažování GPT-5 s nativním generováním obrázků v jednom procesu, což eliminuje potřebu externích nástrojů (DALL-E). Vyznačuje se symetrickou cenovou politikou pro vstup a výstup a vysokým limitem pro generování tokenů.

Silné stránky

Multimodalita

Schopnost generovat text i obrázky v rámci jedné odpovědi s kontextem 400 000 tokenů, což překonává specializované modely s menším oknem.

Výstupní kapacita

Max output 128 000 tokenů umožňuje generovat rozsáhlé dokumenty nebo kódové báze spolu s vizuálními prvky v jednom průchodu.

Instrukce

Vylepšené dodržování složitých promptů pro úpravu obrázků a renderování textu uvnitř grafiky (dědictví GPT Image 1).

Slabé stránky

Cena vstupu

Cena $10.00 za 1M vstupních tokenů je 5x vyšší než u Google Gemini 3 Pro ($2.00) a 2x vyšší než u Claude Opus 4.5 ($5.00), což prodražuje RAG aplikace.

Kontextové okno

Ačkoliv je 400k slušné, zaostává za standardem 1M+ tokenů, který nabízí konkurence (Claude Sonnet 4.5, Gemini 3 Flash/Pro).

🔗 Další modely od Openai