Qwen: Qwen3.5 Plus 2026-02-15

qwen/qwen3.5-plus-02-15

Qwen3.5 Plus je technicky působivý model, který díky hybridní architektuře demokratizuje práci s extrémně dlouhým kontextem a videem za cenu mid-range modelů.

✦

Killer Feature Kombinace lineární pozornosti pro 1M kontext a nativního zpracování videa za cenu pod $0.50/1M.

⚠

Skryté riziko Hybridní architektura může vykazovat specifické artefakty v 'needle-in-a-haystack' testech oproti plným Attention modelům.

$0.4 / 1M vstup

$2.4 / 1M výstup

1.0M kontext

66k max výstup

Výborný hodnocení

textimagevideo text Multimodální zpracování (Video/Text)Efektivita dlouhého kontextu

⚖️ Porovnání s konkurencí

Model	Cenové srovnání	Poznámka
Qwen Qwen3.5 Plus 2026-02-15	← Právě prohlížíte	—
Google Gemini 3 Flash Preview	Qwen je o 20 % levnější na vstupu a o 20 % levnější na výstupu.	Přímý konkurent v 1M kontextu. Qwen nabízí lepší cenu, zatímco Gemini má hlubší integraci do ekosystému Google.
DeepSeek DeepSeek V3.2	DeepSeek je levnější ($0.26 vs $0.40 vstup), výrazně levnější na výstupu.	DeepSeek vede v ceně, ale Qwen nabízí 6x větší kontextové okno (1M vs 164k) a nativní podporu videa.
Anthropic Claude Haiku 4.5	Qwen je 2,5x levnější na vstupu a 2x levnější na výstupu.	Qwen překonává Haiku v délce kontextu (1M vs 200k) a pravděpodobně i v reasoning schopnostech (kategorie Plus vs Haiku).

🎯 Rozhodovací pomocník

✓

Použij když...

Analýza dlouhých video záznamů
Zpracování rozsáhlých dokumentací (až 1M tokenů)
Ekonomicky efektivní sumarizace

✗

Nepoužívej když...

Úlohy vyžadující absolutně nejnižší cenu (zde vede DeepSeek/Mistral)
Generování extrémně dlouhého kódu přesahujícího 65k tokenů

Ideální pro:

Vývojáři RAG aplikacíAnalytici video obsahuPodniky zpracovávající velké objemy dat

💪 Silné a slabé stránky

+ Silné stránky

Efektivita kontextu

Díky lineární pozornosti (Linear Attention) zvládá kontext 1 000 000 tokenů s výrazně nižší výpočetní náročností než standardní Transformer modely.

Cenová agresivita

S cenou $0.40 za 1M vstupních tokenů podbíjí většinu konkurence v kategorii 'Plus/Pro' (např. Gemini 3 Flash je o 25 % dražší na vstupu).

Nativní multimodalita

Schopnost zpracovávat video a obrázky přímo v rámci hybridní architektury bez nutnosti externích vizuálních enkodérů.

− Slabé stránky

Cena výstupu

Poměr ceny vstupu a výstupu (1:6) je méně výhodný než u open-weights konkurence (DeepSeek V3.2 má poměr cca 1:1.5).

Omezení generování

Maximální výstup 65 536 tokenů je sice vysoký, ale u úloh vyžadujících extrémně dlouhé generování textu (např. psaní celých knih) může být limitující oproti kontextu vstupu.

📝 Detailní popis

Modely Qwen3.5 nativní řady pro zpracování obrazu a jazyka Plus jsou postaveny na hybridní architektuře, která integruje mechanismy lineární pozornosti s řídkými modely typu mixture-of-experts, čímž dosahuje vyšší efektivity inference. V různých hodnoceních úloh řada 3.5 konzistentně prokazuje výkon srovnatelný s nejmodernějšími vedoucími modely. Ve srovnání s řadou 3 vykazují tyto modely skokový posun vpřed jak v čistě textových, tak i multimodálních schopnostech.

Unikátní charakteristiky

Model využívá inovativní hybridní architekturu kombinující lineární mechanismy pozornosti (pro efektivní zpracování 1M kontextu) s řídkým Mixture-of-Experts (MoE). Tato kombinace umožňuje modelu ‘Plus’ dosahovat výkonu na úrovni SOTA při zachování nízké latence a nákladů typických pro menší modely.

Silné stránky

Efektivita kontextu