← Zpět na komunitu
Vývoj AI

Anthropic přitvrzuje pravidla pro budoucí AI modely

Anthropic aktualizoval svou politiku odpovědného škálování (RSP), zavádějící přísnější kritéria pro vývoj a nasazení pokročilých AI modelů.

Anthropic přitvrzuje pravidla pro budoucí AI modely

Společnost Anthropic, jeden z předních hráčů v oblasti vývoje umělé inteligence, oznámila aktualizaci své Politiky odpovědného škálování (Responsible Scaling Policy – RSP). Tato revize představuje významné zpřísnění interních pravidel, která určují, za jakých podmínek smí Anthropic trénovat a nasazovat své budoucí, potenciálně mnohem výkonnější AI modely. Krok je vnímán jako snaha o proaktivní řešení rizik spojených s rapidním pokrokem v oblasti generativní AI a má potenciál ovlivnit celý sektor.

Původní RSP, zavedená již dříve, stanovovala obecné principy pro bezpečný vývoj AI. Nejnovější aktualizace však přináší konkrétnější a měřitelnější prahy pro takzvané "AI Safety Levels" (ASL). Tyto úrovně kategorizují potenciální rizika modelů od ASL-1 (minimální riziko) až po ASL-5 (katastrofické riziko). Nově jsou detailněji popsána kritéria a postupy, které musí Anthropic dodržet – včetně povinného pozastavení tréninku nebo nasazení modelu – pokud se při evaluaci zjistí, že model překračuje určité bezpečnostní prahy.

Zpřísnění evaluací a transparentnost

Klíčovým prvkem aktualizované politiky je rozšíření a zpřesnění povinných evaluací schopností modelů. Před uvolněním modelů vyšších bezpečnostních tierů bude Anthropic muset provést detailní testování v několika kritických oblastech. Mezi ně patří například schopnost AI v oblasti biologie, kde se zkoumá potenciál modelu k usnadnění vývoje biologických zbraní nebo jiných škodlivých aplikací. Dále se zaměřuje na kyberbezpečnost, kde se testuje, zda model dokáže autonomně identifikovat a zneužívat zranitelnosti v systémech, či na jeho schopnost autonomního jednání a plánování, což by mohlo vést k neúmyslným nebo nekontrolovatelným dopadům v reálném světě.

Anthropic se v rámci nové politiky také zavazuje k bezprecedentní úrovni transparentnosti a externího dohledu. Politika explicitně uvádí požadavek na nezávislý audit třetí stranou, který má ověřovat dodržování stanovených pravidel a evaluací. Výsledky těchto auditů, stejně jako interní zprávy o pokroku a zjištěných rizicích, mají být transparentně reportovány. Cílem je nejen budovat důvěru u veřejnosti a regulačních orgánů, ale také vytvořit jakýsi "industry benchmark" – standard pro odpovědné škálování, který by mohl inspirovat nebo dokonce nutit i ostatní vývojáře frontier AI modelů k přijetí podobných samoregulačních mechanismů.

Dopady na odvětví a regulaci

Krok Anthropicu má širší dopad než jen na interní procesy firmy. V době intenzivní konkurence mezi technologickými giganty v oblasti AI představuje přijetí takto přísných self-binding pravidel významný signál. Může vyvinout tlak na ostatní společnosti, aby rovněž zavedly robustnější bezpečnostní protokoly a transparentní reporting, pokud si nechtějí poškodit reputaci nebo čelit přísnější externí regulaci. Zároveň aktualizace RSP přichází v době, kdy se globálně, a zejména v Evropě, intenzivně diskutuje o legislativním rámci pro umělou inteligenci, jako je například evropský AI Act. Detaily a závazky v politice Anthropicu by tak mohly ovlivnit i směr a požadavky budoucích mezinárodních regulací, zejména pokud jde o "frontier modely", tedy ty nejvýkonnější a potenciálně nejrizikovější AI systémy.

Co to znamená pro vaši firmu

Zdroj Anthropic News →