Gemma 3 přináší multimodalitu, podporuje vstup v podobě obrazu a jazyka a textové výstupy. Zvládá kontextová okna až do 128 tisíc tokenů, rozumí více než 140 jazykům a nabízí vylepšené matematické, logické a chatovací schopnosti, včetně strukturovaných výstupů a volání funkcí. Gemma 3 12B je druhý největší model z rodiny modelů Gemma 3 po Gemma 3 27B.
Unikátní charakteristiky
Gemma 3 12B představuje vysoce efektivní model střední velikosti, který přináší nativní schopnosti zpracování obrazu do kategorie nízkonákladových modelů. Vyniká extrémně agresivní cenovou politikou a podporou více než 140 jazyků při zachování solidního kontextového okna.
Silné stránky
Cena/Výkon
S cenou $0.03 za 1M vstupních tokenů je model výrazně levnější než většina konkurence, což umožňuje masivní škálování.
Multimodalita
Schopnost zpracovávat obrazové vstupy (image-to-text) je v této cenové a velikostní kategorii (12B) vzácná a vysoce konkurenceschopná.
Jazyková podpora
Optimalizace pro více než 140 jazyků činí model ideálním pro globální aplikace a překladatelské úlohy s nízkou latencí.
Slabé stránky
Hloubka uvažování
Jako 12B model nedosahuje v komplexních logických úlohách a hlubokém uvažování kvalit větších modelů (např. Gemma 3 27B nebo Claude Sonnet).
Kontextové okno
Kapacita 131k tokenů je dostatečná pro běžné úlohy, ale zaostává za konkurencí nabízející 200k až 2M tokenů (např. Mistral nebo x-AI).