Q
Qwen 16. 2. 2026
86 skóre

Qwen: Qwen3.5 Plus 2026-02-15

qwen/qwen3.5-plus-02-15

Qwen3.5 Plus je technicky působivý model, který díky hybridní architektuře demokratizuje práci s extrémně dlouhým kontextem a videem za cenu mid-range modelů.

Killer Feature Kombinace lineární pozornosti pro 1M kontext a nativního zpracování videa za cenu pod $0.50/1M.
Skryté riziko Hybridní architektura může vykazovat specifické artefakty v 'needle-in-a-haystack' testech oproti plným Attention modelům.
$0.4 / 1M vstup
$2.4 / 1M výstup
1.0M kontext
66k max výstup
Výborný hodnocení
textimagevideo text Multimodální zpracování (Video/Text)Efektivita dlouhého kontextu

📊 Benchmarky

👁️ Multimodalita
90
Výborný
📏 Kontextové okno
95
Výborný
🧠 Reasoning
82
Dobrý
💰 Cena/Výkon
88
Výborný
💻 Programování
78
Dobrý
Celkové skóre 86/100

⚖️ Porovnání s konkurencí

Model Cenové srovnání Poznámka
Qwen Qwen3.5 Plus 2026-02-15
← Právě prohlížíte
Qwen je o 20 % levnější na vstupu a o 20 % levnější na výstupu. Přímý konkurent v 1M kontextu. Qwen nabízí lepší cenu, zatímco Gemini má hlubší integraci do ekosystému Google.
DeepSeek DeepSeek V3.2
DeepSeek je levnější ($0.26 vs $0.40 vstup), výrazně levnější na výstupu. DeepSeek vede v ceně, ale Qwen nabízí 6x větší kontextové okno (1M vs 164k) a nativní podporu videa.
Anthropic Claude Haiku 4.5
Qwen je 2,5x levnější na vstupu a 2x levnější na výstupu. Qwen překonává Haiku v délce kontextu (1M vs 200k) a pravděpodobně i v reasoning schopnostech (kategorie Plus vs Haiku).

🎯 Rozhodovací pomocník

Použij když...

  • Analýza dlouhých video záznamů
  • Zpracování rozsáhlých dokumentací (až 1M tokenů)
  • Ekonomicky efektivní sumarizace

Nepoužívej když...

  • Úlohy vyžadující absolutně nejnižší cenu (zde vede DeepSeek/Mistral)
  • Generování extrémně dlouhého kódu přesahujícího 65k tokenů
Ideální pro:
Vývojáři RAG aplikacíAnalytici video obsahuPodniky zpracovávající velké objemy dat

💪 Silné a slabé stránky

+ Silné stránky

Efektivita kontextu

Díky lineární pozornosti (Linear Attention) zvládá kontext 1 000 000 tokenů s výrazně nižší výpočetní náročností než standardní Transformer modely.

Cenová agresivita

S cenou $0.40 za 1M vstupních tokenů podbíjí většinu konkurence v kategorii 'Plus/Pro' (např. Gemini 3 Flash je o 25 % dražší na vstupu).

Nativní multimodalita

Schopnost zpracovávat video a obrázky přímo v rámci hybridní architektury bez nutnosti externích vizuálních enkodérů.

Slabé stránky

Cena výstupu

Poměr ceny vstupu a výstupu (1:6) je méně výhodný než u open-weights konkurence (DeepSeek V3.2 má poměr cca 1:1.5).

Omezení generování

Maximální výstup 65 536 tokenů je sice vysoký, ale u úloh vyžadujících extrémně dlouhé generování textu (např. psaní celých knih) může být limitující oproti kontextu vstupu.

📝 Detailní popis

Modely Qwen3.5 nativní řady pro zpracování obrazu a jazyka Plus jsou postaveny na hybridní architektuře, která integruje mechanismy lineární pozornosti s řídkými modely typu mixture-of-experts, čímž dosahuje vyšší efektivity inference. V různých hodnoceních úloh řada 3.5 konzistentně prokazuje výkon srovnatelný s nejmodernějšími vedoucími modely. Ve srovnání s řadou 3 vykazují tyto modely skokový posun vpřed jak v čistě textových, tak i multimodálních schopnostech.

Unikátní charakteristiky

Model využívá inovativní hybridní architekturu kombinující lineární mechanismy pozornosti (pro efektivní zpracování 1M kontextu) s řídkým Mixture-of-Experts (MoE). Tato kombinace umožňuje modelu ‘Plus’ dosahovat výkonu na úrovni SOTA při zachování nízké latence a nákladů typických pro menší modely.

Silné stránky

Efektivita kontextu

Díky lineární pozornosti (Linear Attention) zvládá kontext 1 000 000 tokenů s výrazně nižší výpočetní náročností než standardní Transformer modely.

Cenová agresivita

S cenou $0.40 za 1M vstupních tokenů podbíjí většinu konkurence v kategorii ‘Plus/Pro’ (např. Gemini 3 Flash je o 25 % dražší na vstupu).

Nativní multimodalita

Schopnost zpracovávat video a obrázky přímo v rámci hybridní architektury bez nutnosti externích vizuálních enkodérů.

Slabé stránky

Cena výstupu

Poměr ceny vstupu a výstupu (1:6) je méně výhodný než u open-weights konkurence (DeepSeek V3.2 má poměr cca 1:1.5).

Omezení generování

Maximální výstup 65 536 tokenů je sice vysoký, ale u úloh vyžadujících extrémně dlouhé generování textu (např. psaní celých knih) může být limitující oproti kontextu vstupu.

🔗 Další modely od Qwen