GPT-5 Image Mini kombinuje pokročilé jazykové schopnosti OpenAI, poháněné GPT-5 Mini, s GPT Image 1 Mini pro efektivní generování obrázků. Tento nativně multimodální model se vyznačuje vynikajícím dodržováním instrukcí, vykreslováním textu a detailní úpravou obrázků se sníženou latencí a náklady. Vyniká ve vysoce kvalitní vizuální tvorbě při zachování silného porozumění textu, což ho činí ideálním pro aplikace, které vyžadují efektivní generování obrázků a zpracování textu ve velkém měřítku.
Unikátní charakteristiky
GPT-5 Image Mini představuje specializovanou variantu řady GPT-5, která integruje pokročilé jazykové schopnosti s efektivním generováním obrazu v jednom modelu. Unikátní je cenová struktura s velmi nízkou cenou za výstupní tokeny ($2.00/1M) vzhledem k obrazovým schopnostem, což podporuje velkoobjemovou vizuální produkci.
Silné stránky
Cena výstupu
Cena $2.00 za 1M výstupních tokenů je výrazně nižší než u konkurenčních modelů generujících obraz (např. Gemini 3 Pro Image Preview stojí $12.00), což zlevňuje generování vizuálního obsahu.
Vykreslování textu
Model specificky cílí na slabinu předchozích generací (DALL-E 3) a nabízí superiorní rendering čitelného textu přímo v generovaných obrázcích.
Kontextové okno
Kapacita 400,000 tokenů umožňuje zpracovávat rozsáhlé podklady pro generování, což je výrazně více než 65k u Gemini 3 Pro Image Preview.
Slabé stránky
Cena vstupu
Vstupní cena $2.50/1M je vysoká pro kategorii ‘Mini’ modelů; pro čistě textové úlohy jsou modely jako Gemini 3 Flash ($0.50) nebo Grok-4.1 ($0.20) ekonomičtější.
Reasoning limity
Jako ‘Mini’ varianta nedosahuje hloubky uvažování plných modelů (např. Claude Opus 4.5), což může limitovat komplexní logické operace nad vizuálními daty.