Řada Qwen3.5 35B-A3B je nativní model pro vidění a jazyk navržený s hybridní architekturou, která integruje mechanismy lineární pozornosti a řídký model směsi expertů, čímž dosahuje vyšší efektivity inference. Jeho celkový výkon je srovnatelný s výkonem modelu Qwen3.5-27B.
Unikátní charakteristiky
Model využívá unikátní hybridní architekturu kombinující mechanismy lineární pozornosti se sparse Mixture-of-Experts (MoE), což umožňuje zpracování dlouhého kontextu s výrazně nižšími výpočetními nároky než standardní transformery. Jde o nativně multimodální model schopný analyzovat text, obraz i video.
Silné stránky
Multimodální schopnosti
Nativní podpora pro analýzu videa a obrazu v rámci jednoho modelu, což eliminuje potřebu samostatných vision encoderů a zvyšuje přesnost.
Efektivita architektury
Díky lineární pozornosti a MoE dosahuje model srovnatelného výkonu jako Qwen3.5-27B, ale s vyšší propustností a nižší latencí při dlouhých sekvencích.
Kontextové okno
Kapacita 262 144 tokenů je dostatečná pro analýzu rozsáhlých dokumentů nebo delších video segmentů, přičemž lineární pozornost zajišťuje stabilitu.
Slabé stránky
Cena výstupu
Cena $2.00 za 1M výstupních tokenů je výrazně vyšší (až 5x-10x) než u přímých konkurentů jako DeepSeek nebo Mistral v podobné výkonnostní třídě.
Výkonnostní strop
Jako model střední velikosti (35B) nedosahuje v komplexním uvažování (reasoning) kvalit ‘Pro’ modelů (např. Gemini 3.1 Pro nebo Claude Opus).