S
Stepfun 30. 1. 2026
82 skóre

StepFun: Step 3.5 Flash (free)

stepfun/step-3.5-flash:free

Step 3.5 Flash je ideální volbou pro projekty vyžadující vysokou rychlost a extrémně dlouhé generované výstupy bez provozních nákladů, vhodný zejména pro textové transformace.

Killer Feature Kombinace nulové ceny a masivního výstupního limitu 256 000 tokenů, který umožňuje generovat romány či kompletní reporty na jeden prompt.
Skryté riziko Jako bezplatný model může mít nižší garance dostupnosti (SLA) a potenciálně přísnější rate-limity při vysoké zátěži.
$0 / 1M vstup
$0 / 1M výstup
256k kontext
256k max výstup
Dobrý hodnocení
text text ReasoningEfektivitaDlouhý kontext

📊 Benchmarky

🧠 Reasoning
80
Dobrý
Rychlost
88
Výborný
📏 Kontextové okno
75
Dobrý
💰 Cena/Výkon
100
Výborný
💻 Programování
76
Dobrý
Celkové skóre 82/100

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Stepfun Step 3.5 Flash (free)
← Právě prohlížíte
MistralAI devstral-2512
StepFun je zdarma, Mistral stojí $0.05/$0.22 (velmi levný) Mistral nabízí podobné kontextové okno (262k), ale StepFun má výrazně vyšší limit výstupu. Devstral je pravděpodobně lépe optimalizován pro čistý kód.
StepFun je zdarma, Google stojí $0.50/$3.00 Gemini 3 Flash nabízí 4x větší kontext (1M) a multimodalitu, ale je výrazně dražší. StepFun je lepší volbou pro čistě textové úlohy s dlouhým generováním.
DeepSeek deepseek-v3.2
StepFun je zdarma, DeepSeek stojí $0.25/$0.38 Oba modely využívají MoE architekturu pro efektivitu. DeepSeek má menší kontext (163k), ale je silným konkurentem v oblasti logiky a kódování.

🎯 Rozhodovací pomocník

Použij když...

  • Generování rozsáhlé dokumentace nebo beletrie
  • Dávkové zpracování a klasifikace textů
  • Rychlé prototypování aplikací bez nákladů na API

Nepoužívej když...

  • Analýza obrazu nebo zvuku
  • Úlohy vyžadující kontext nad 256k tokenů (např. analýza celých repozitářů)
Ideální pro:
Vývojáři s omezeným rozpočtemAutoři dlouhých textůVýzkumníci vyžadující hromadné zpracování dat

💪 Silné a slabé stránky

+ Silné stránky

Cenová politika

Model je nabízen zcela zdarma ($0.00 za vstup i výstup), což poskytuje bezkonkurenční poměr cena/výkon oproti placeným modelům.

Generativní kapacita

Podpora výstupu až 256 000 tokenů je v odvětví výjimečná, většina konkurentů omezuje výstup na 4k-8k tokenů, což umožňuje generování celých knih nebo rozsáhlých kódových bází v jednom kroku.

Latence

Díky aktivaci pouze 11B parametrů dosahuje model rychlosti srovnatelné s malými modely (např. Haiku, Flash), přestože disponuje znalostní bází velkého modelu.

Slabé stránky

Modalita

Omezení pouze na text-to-text znevýhodňuje model oproti multimodálním konkurentům jako Gemini 3 Flash (zpracování obrazu/videa) nebo GPT-Audio.

Velikost kontextu

Ačkoliv je 256k tokenů solidní hodnota, zaostává za modely jako Gemini 3 Flash (1M) nebo Grok 4.1 (2M), které zvládnou analyzovat násobně větší objemy dat.

📝 Detailní popis

Krok 3.5 Flash je nejvýkonnější open-source základový model společnosti StepFun. Je postaven na řídké architektuře Mixture of Experts (MoE) a selektivně aktivuje pouze 11 miliard ze svých 196 miliard parametrů na token. Jedná se o model pro usuzování, který je neuvěřitelně rychlý i při dlouhých kontextech.

Unikátní charakteristiky

Step 3.5 Flash využívá architekturu Sparse MoE, která umožňuje modelu s celkovými 196 miliardami parametrů aktivovat pouze 11 miliard na token, což zajišťuje vysokou inferenční rychlost při zachování hlubokých znalostí. Model je specificky optimalizován pro logické uvažování (reasoning) a zpracování dlouhých kontextů s extrémně velkorysým limitem pro výstup.

Silné stránky

Cenová politika

Model je nabízen zcela zdarma ($0.00 za vstup i výstup), což poskytuje bezkonkurenční poměr cena/výkon oproti placeným modelům.

Generativní kapacita

Podpora výstupu až 256 000 tokenů je v odvětví výjimečná, většina konkurentů omezuje výstup na 4k-8k tokenů, což umožňuje generování celých knih nebo rozsáhlých kódových bází v jednom kroku.

Latence

Díky aktivaci pouze 11B parametrů dosahuje model rychlosti srovnatelné s malými modely (např. Haiku, Flash), přestože disponuje znalostní bází velkého modelu.

Slabé stránky

Modalita

Omezení pouze na text-to-text znevýhodňuje model oproti multimodálním konkurentům jako Gemini 3 Flash (zpracování obrazu/videa) nebo GPT-Audio.

Velikost kontextu

Ačkoliv je 256k tokenů solidní hodnota, zaostává za modely jako Gemini 3 Flash (1M) nebo Grok 4.1 (2M), které zvládnou analyzovat násobně větší objemy dat.