StepFun: Step 3.5 Flash (free)

stepfun/step-3.5-flash:free

Step 3.5 Flash je ideální volbou pro projekty vyžadující vysokou rychlost a extrémně dlouhé generované výstupy bez provozních nákladů, vhodný zejména pro textové transformace.

✦

Killer Feature Kombinace nulové ceny a masivního výstupního limitu 256 000 tokenů, který umožňuje generovat romány či kompletní reporty na jeden prompt.

⚠

Skryté riziko Jako bezplatný model může mít nižší garance dostupnosti (SLA) a potenciálně přísnější rate-limity při vysoké zátěži.

$0 / 1M vstup

$0 / 1M výstup

256k kontext

256k max výstup

Dobrý hodnocení

text text ReasoningEfektivitaDlouhý kontext

⚖️ Porovnání s konkurencí

Model	Cenové srovnání	Poznámka
Stepfun Step 3.5 Flash (free)	← Právě prohlížíte	—
MistralAI devstral-2512	StepFun je zdarma, Mistral stojí $0.05/$0.22 (velmi levný)	Mistral nabízí podobné kontextové okno (262k), ale StepFun má výrazně vyšší limit výstupu. Devstral je pravděpodobně lépe optimalizován pro čistý kód.
Google gemini-3-flash-preview	StepFun je zdarma, Google stojí $0.50/$3.00	Gemini 3 Flash nabízí 4x větší kontext (1M) a multimodalitu, ale je výrazně dražší. StepFun je lepší volbou pro čistě textové úlohy s dlouhým generováním.
DeepSeek deepseek-v3.2	StepFun je zdarma, DeepSeek stojí $0.25/$0.38	Oba modely využívají MoE architekturu pro efektivitu. DeepSeek má menší kontext (163k), ale je silným konkurentem v oblasti logiky a kódování.

🎯 Rozhodovací pomocník

✓

Použij když...

Generování rozsáhlé dokumentace nebo beletrie
Dávkové zpracování a klasifikace textů
Rychlé prototypování aplikací bez nákladů na API

✗

Nepoužívej když...

Analýza obrazu nebo zvuku
Úlohy vyžadující kontext nad 256k tokenů (např. analýza celých repozitářů)

Ideální pro:

Vývojáři s omezeným rozpočtemAutoři dlouhých textůVýzkumníci vyžadující hromadné zpracování dat

💪 Silné a slabé stránky

+ Silné stránky

Cenová politika

Model je nabízen zcela zdarma ($0.00 za vstup i výstup), což poskytuje bezkonkurenční poměr cena/výkon oproti placeným modelům.

Generativní kapacita

Podpora výstupu až 256 000 tokenů je v odvětví výjimečná, většina konkurentů omezuje výstup na 4k-8k tokenů, což umožňuje generování celých knih nebo rozsáhlých kódových bází v jednom kroku.

Latence

Díky aktivaci pouze 11B parametrů dosahuje model rychlosti srovnatelné s malými modely (např. Haiku, Flash), přestože disponuje znalostní bází velkého modelu.

− Slabé stránky

Modalita

Omezení pouze na text-to-text znevýhodňuje model oproti multimodálním konkurentům jako Gemini 3 Flash (zpracování obrazu/videa) nebo GPT-Audio.

Velikost kontextu

Ačkoliv je 256k tokenů solidní hodnota, zaostává za modely jako Gemini 3 Flash (1M) nebo Grok 4.1 (2M), které zvládnou analyzovat násobně větší objemy dat.

📝 Detailní popis

Krok 3.5 Flash je nejvýkonnější open-source základový model společnosti StepFun. Je postaven na řídké architektuře Mixture of Experts (MoE) a selektivně aktivuje pouze 11 miliard ze svých 196 miliard parametrů na token. Jedná se o model pro usuzování, který je neuvěřitelně rychlý i při dlouhých kontextech.

Unikátní charakteristiky

Step 3.5 Flash využívá architekturu Sparse MoE, která umožňuje modelu s celkovými 196 miliardami parametrů aktivovat pouze 11 miliard na token, což zajišťuje vysokou inferenční rychlost při zachování hlubokých znalostí. Model je specificky optimalizován pro logické uvažování (reasoning) a zpracování dlouhých kontextů s extrémně velkorysým limitem pro výstup.

Silné stránky

Cenová politika