Llama Guard 3 je předtrénovaný model Llama-3.1-8B, doladěný pro klasifikaci bezpečnosti obsahu. Podobně jako předchozí verze, může být použit ke klasifikaci obsahu jak ve vstupech LLM (klasifikace promptu), tak v odpovědích LLM (klasifikace odpovědi). Funguje jako LLM – generuje text ve svém výstupu, který indikuje, zda je daný prompt nebo odpověď bezpečný nebo nebezpečný, a pokud je nebezpečný, také vypisuje kategorie obsahu, které byly porušeny.
Llama Guard 3 byl sladěn tak, aby chránil proti standardizované taxonomii rizik MLCommons a byl navržen tak, aby podporoval schopnosti Llama 3.1. Konkrétně poskytuje moderování obsahu v 8 jazycích a byl optimalizován pro podporu bezpečnosti a zabezpečení pro vyhledávání a volání nástrojů interpretu kódu.
Unikátní charakteristiky
Llama Guard 3 je model pro klasifikaci bezpečnosti obsahu, optimalizovaný pro Llama 3.1. Podporuje moderování obsahu v 8 jazycích a je navržen pro bezpečnost vyhledávání a nástrojů pro interpretaci kódu.
Silné stránky
Bezpečnost obsahu
Specializuje se na klasifikaci obsahu jako bezpečný nebo nebezpečný, což je klíčové pro moderování obsahu.
Vícejazyčnost
Podporuje moderování obsahu v 8 jazycích, což rozšiřuje jeho použitelnost v globálním měřítku.
Slabé stránky
Obecná inteligence
Není určen pro obecné úkoly LLM, ale spíše pro specifické moderování obsahu.
Benchmark data
Benchmark data nejsou k dispozici, takže je obtížné objektivně posoudit jeho výkon ve srovnání s konkurencí.