Pro úlohy, které vyžadují nízkou latenci, je GPT-4.1 nano nejrychlejší a nejlevnější model v řadě GPT-4.1. Poskytuje výjimečný výkon v malém provedení s kontextovým oknem o velikosti 1 milionu tokenů a dosahuje skóre 80,1 % na MMLU, 50,3 % na GPQA a 9,8 % na Aider polyglot coding – dokonce vyšší než GPT-4o mini. Je ideální pro úlohy jako klasifikace nebo automatické doplňování.
Unikátní charakteristiky
GPT-4.1 Nano představuje agresivní posun v kategorii ‘edge’ modelů kombinací masivního kontextového okna (1M tokenů) s extrémně nízkou cenou. Model je optimalizován pro rychlé úlohy s nízkou latencí, přičemž si zachovává slušnou obecnou znalost (MMLU 80.1%), ale obětuje schopnosti v komplexním kódování.
Silné stránky
Kontextové okno
Kapacita 1 047 576 tokenů je v cenové kategorii $0.10/1M bezkonkurenční, umožňuje zpracování celých knih či velkých logů.
Poměr Cena/Výkon
S cenou $0.10 za 1M vstupních tokenů je model ideální pro vysokoobjemové zpracování dat, kde by dražší modely byly ekonomicky neúnosné.
Obecné znalosti
Skóre 80.1% v MMLU je pro ‘nano’ model velmi vysoké a překonává starší vlajkové lodě (např. původní GPT-3.5).
Slabé stránky
Programování
Skóre 9.8% v Aider polyglot benchmarku je nízké; model není vhodný pro autonomní vývoj softwaru nebo složité refaktorování.
Komplexní uvažování
Výsledek 50.3% v GPQA naznačuje limity v řešení složitých vědeckých nebo logických problémů, kde je nutná hluboká dedukce.