Byla spuštěna nová verze modelu Gemini 3.1 Flash Live, dostupná přes Gemini Live API v Google AI Studio. Model umožňuje vývojářům vytvářet hlasové a vizuální agenty v reálném čase s nízkou latencí a přirozenějším dialogem. Zlepšuje plnění úkolů v hlučném prostředí, přesněji následuje instrukce a podporuje více než 90 jazyků. Technologii využívají například aplikace Stitch, Hey Ato a Wits End. 👉
Zprávičky
Krátké zprávy ze světa AI a vibecoding nástrojůMistral AI vydal open-weight model Voxtral TTS pro převod textu na řeč. Model podporuje devět jazyků, různé dialekty, nabízí nízkou latenci a je přizpůsobitelný novým hlasům. 👉
Společnost Cohere představila Cohere Transcribe, nový open-source model pro automatické rozpoznávání řeči (ASR), který je dle firmy nejlepším ve své třídě. Model dosahuje nejvyšší přesnosti na žebříčku Hugging Face Open ASR, kde překonává konkurenční modely jako Whisper Large v3 od OpenAI. Je navržen pro produkční nasazení s důrazem na přesnost i efektivitu a je dostupný volně ke stažení, přes API i v rámci platformy Model Vault. 👉
Společnost Google představila TurboQuant, sadu pokročilých kvantizačních algoritmů, které umožňují extrémní kompresi pro velké jazykové modely a vektorové vyhledávače. Tato technika výrazně snižuje paměťové nároky, zejména v tzv. key-value cache, a zrychluje běh modelů bez ztráty přesnosti. Testy na modelech jako Gemma a Mistral prokázaly, že TurboQuant dokáže zkomprimovat data na pouhé 3 bity a zároveň dosáhnout výrazně vyššího výkonu při výpočtech. 👉
Aplikace Sora bude ukončena. Později budou sdíleny další informace, včetně časového plánu pro ukončení aplikace i API a podrobností o zálohování vytvořeného obsahu. 👉
Byl spuštěn ARC-AGI-3, interaktivní benchmark pro testování umělé inteligence v oblasti uvažování. Obsahuje přes 1000 úrovní ve více než 150 prostředích, ve kterých je třeba řešit úkoly podobné videohrám bez instrukcí. V předchozí verzi ARC-AGI-1 dosáhl nejvyššího skóre Gemini 3.1 Pro (98 %) a v ARC-AGI-2 👉
CEO společnosti Nvidia Jensen Huang v podcastu Lexe Fridmana prohlásil, že jsme podle něj již dosáhli obecné umělé inteligence (AGI). Svůj výrok však následně zmírnil s tím, že ačkoliv existují AI agenti jako OpenClaw, pravděpodobnost, že by vybudovali další Nvidii, je prakticky nulová. 👉
Accio Work je desktopová, lokálně fungující AI platforma pro automatizaci firemních úkolů. Umožňuje vytvářet AI agenty pro správu obchodů na Shopify, organizaci souborů nebo automatizaci práce v prohlížeči a e-mailu. Platforma se integruje se službami jako Gmail a Notion a podporuje modely Gemini, 👉
Byl spuštěn Open Wallet Standard (OWS), open-source standard, který sjednocuje interakci softwarových agentů s kryptoměnovými peněženkami. Projekt je podporován společnostmi PayPal, OKX, Ripple, Tron, TON, Solana, Ethereum, Base, Polygon a dalšími. 👉
Společnost MiniMax představila předplatitelský tarif „MiniMax Token Plan“. Ten nabízí API přístup ke všem modelům společnosti (text, řeč, hudba, video a obraz) za paušální poplatek. 👉