GPT-5.3-Codex je nejpokročilejší agentní kódovací model od OpenAI, který kombinuje špičkový výkon softwarového inženýrství modelu GPT-5.2-Codex s širšími schopnostmi usuzování a odbornými znalostmi modelu GPT-5.2. Dosahuje nejlepších výsledků ve SWE-Bench Pro a silného výkonu v Terminal-Bench 2.0 a OSWorld-Verified, což odráží vylepšené více-jazykové kódování, odbornost v terminálu a dovednosti v používání počítače v reálném světě. Model je optimalizován pro dlouhotrvající pracovní postupy využívající nástroje a podporuje interaktivní řízení během provádění, díky čemuž je vhodný pro komplexní vývojové úlohy, ladění, nasazení a iterativní práci na produktech.
Kromě kódování si GPT-5.3-Codex vede dobře v benchmarkách pro strukturovanou práci s informacemi, jako je GDPval, a podporuje úlohy jako je návrh dokumentů, analýza tabulek, tvorba prezentací a operační výzkum napříč obory. Je trénován s vylepšeným povědomím o kybernetické bezpečnosti, včetně schopností identifikace zranitelností, a nasazen s dodatečnými bezpečnostními opatřeními pro vysoce rizikové případy použití. Ve srovnání s předchozími modely Codex je tokenově efektivnější a přibližně o 25 % rychlejší, přičemž cílí na profesionální end-to-end pracovní postupy, které zahrnují usuzování, provádění a interakci s počítačem.
Unikátní charakteristiky
GPT-5.3-Codex představuje posun od čistého generování textu k agentnímu chování, kombinující SOTA schopnosti v softwarovém inženýrství s ovládáním terminálu a operačního systému. Model je specificky navržen pro dlouhodobé úlohy s velkým výstupním oknem (128k), což umožňuje generování celých modulů a iterativní ladění v reálném čase.
Silné stránky
Agentní schopnosti
Vynikající výsledky v SWE-Bench Pro a OSWorld-Verified dokazují schopnost samostatně řešit komplexní tickety a ovládat počítačové rozhraní.
Výstupní kapacita
Max output 128 000 tokenů je výrazně nad standardem konkurence, což je klíčové pro rozsáhlý refactoring nebo generování dokumentace v jednom průchodu.
Bezpečnost kódu
Integrovaná identifikace zranitelností a optimalizace pro kyberbezpečnostní úlohy zvyšuje spolehlivost generovaného softwaru.
Slabé stránky
Kontextové okno
Kapacita 400 000 tokenů je výrazně nižší než 1M+ u modelů Claude Sonnet 4.6 nebo Gemini 3.1, což limituje práci s obřími monorepy bez RAG.
Provozní náklady
Cena $14.00 za 1M výstupních tokenů je vysoká pro rutinní úlohy ve srovnání s modely jako Mistral Devstral nebo DeepSeek.