Krok 3.5 Flash je nejvýkonnější open-source základový model společnosti StepFun. Je postaven na řídké architektuře Mixture of Experts (MoE) a selektivně aktivuje pouze 11 miliard ze svých 196 miliard parametrů na token. Jedná se o model pro usuzování, který je neuvěřitelně rychlý i při dlouhých kontextech.
Unikátní charakteristiky
Step 3.5 Flash využívá architekturu Sparse MoE, která umožňuje modelu s celkovými 196 miliardami parametrů aktivovat pouze 11 miliard na token, což zajišťuje vysokou inferenční rychlost při zachování hlubokých znalostí. Model je specificky optimalizován pro logické uvažování (reasoning) a zpracování dlouhých kontextů s extrémně velkorysým limitem pro výstup.
Silné stránky
Cenová politika
Model je nabízen zcela zdarma ($0.00 za vstup i výstup), což poskytuje bezkonkurenční poměr cena/výkon oproti placeným modelům.
Generativní kapacita
Podpora výstupu až 256 000 tokenů je v odvětví výjimečná, většina konkurentů omezuje výstup na 4k-8k tokenů, což umožňuje generování celých knih nebo rozsáhlých kódových bází v jednom kroku.
Latence
Díky aktivaci pouze 11B parametrů dosahuje model rychlosti srovnatelné s malými modely (např. Haiku, Flash), přestože disponuje znalostní bází velkého modelu.
Slabé stránky
Modalita
Omezení pouze na text-to-text znevýhodňuje model oproti multimodálním konkurentům jako Gemini 3 Flash (zpracování obrazu/videa) nebo GPT-Audio.
Velikost kontextu
Ačkoliv je 256k tokenů solidní hodnota, zaostává za modely jako Gemini 3 Flash (1M) nebo Grok 4.1 (2M), které zvládnou analyzovat násobně větší objemy dat.