Claude Sonnet 4.5 je nejpokročilejší model Sonnet od společnosti Anthropic k dnešnímu dni, optimalizovaný pro agenty v reálném světě a pracovní postupy kódování. Dosahuje špičkového výkonu v kódovacích benchmarkách, jako je SWE-bench Verified, s vylepšeními v oblasti návrhu systému, zabezpečení kódu a dodržování specifikací. Model je navržen pro rozšířený autonomní provoz, udržuje kontinuitu úkolů napříč relacemi a poskytuje sledování pokroku založené na faktech.
Sonnet 4.5 také zavádí silnější agentní schopnosti, včetně vylepšené orchestrace nástrojů, spekulativního paralelního provádění a efektivnějšího kontextu a správy paměti. Díky vylepšenému sledování kontextu a povědomí o využití tokenů napříč voláními nástrojů je obzvláště vhodný pro multi-kontextové a dlouhotrvající pracovní postupy. Případy použití zahrnují softwarové inženýrství, kybernetickou bezpečnost, finanční analýzu, výzkumné agenty a další domény vyžadující trvalé uvažování a používání nástrojů.
Unikátní charakteristiky
Claude Sonnet 4.5 představuje střední třídu nové generace modelů Anthropic, která kombinuje masivní kontextové okno (1M tokenů) s vysokou kapacitou výstupu (64k tokenů). Model je specificky vyladěn pro ‘agentní’ chování, udržování stavu v dlouhých konverzacích a robustní práci s nástroji (tool use), což jej staví do role specialisty na komplexní programátorské úlohy.
Silné stránky
Kontext a Výstup
Kombinace 1 000 000 tokenů na vstupu a 64 000 tokenů na výstupu umožňuje zpracování a generování celých softwarových modulů v jediném průchodu.
Agentní schopnosti
State-of-the-art výkon v benchmarcích jako SWE-bench Verified díky vylepšené orchestraci nástrojů a sledování kontextu napříč relacemi.
Programování
Optimalizace pro dodržování specifikací a bezpečnost kódu, překonávající předchozí generace v přesnosti implementace.
Slabé stránky
Cena výstupu
Cena $15.00 za 1M výstupních tokenů je relativně vysoká ve srovnání s konkurencí jako Gemini 3 Pro ($12.00) nebo GPT-Audio Mini ($2.40).
Rychlost
Jako model zaměřený na ‘reasoning’ a velké kontexty bude pravděpodobně pomalejší než modely třídy Flash/Haiku, což může limitovat použití v real-time aplikacích.