5. 2. 06:13
GPT-5.2 s vysokým úrovní reasoning effort dosahuje 50% úspěšnosti při řešení softwarových úloh průměrně za 6,6 hodin (interval spolehlivosti 3 hodiny 20 minut až 17 hodin 30 minut). Jde o nejvyšší naměřenou hodnotu časového horizontu v rámci testovací sady METR. 👉