
Anthropic zaproponował nowe ramy polityki AI w miarę jak zaawansowane systemy zyskują coraz większe możliwości.
Firma chce, aby rządy ustaliły zasady dotyczące modeli granicznych i przygotowały pracowników na wpływ AI na gospodarkę. Jej plan obejmuje niebezpieczne wdrożenia, niezależne testowanie, cyberbezpieczeństwo i odporność publiczną.
Anthropic przedstawił dwie propozycje w ramach swojego planu „Polityka w sprawie wykładniczego wzrostu AI”. Zaawansowane Ramy AI koncentrują się na potężnych modelach, natomiast Ramy Polityki Gospodarczej odnoszą się do pracowników i wspólnych korzyści finansowych. Firma argumentowała, że AI rozwija się obecnie szybciej niż obecne systemy kształtowania polityki. Stwierdziła również, że rządy potrzebują uprawnień do blokowania lub powstrzymywania niebezpiecznych wdrożeń modeli.
Zgodnie z planem, kary cywilne byłyby powiązane z globalnymi rocznymi przychodami. Powtarzające się naruszenia skutkowałyby wyższymi karami, zgodnie z proponowanymi ramami. Ramy te wzywają również twórców modeli granicznych do testowania modeli przed ich wydaniem. Twórcy publikowaliby streszczenia, ramy bezpieczeństwa i karty systemowe dla potężnych systemów AI.
Niezależni ewaluatorzy przeglądaliby testy modeli i raporty ryzyka. Anthropic chce również, aby deweloperzy utrzymywali silne programy bezpieczeństwa dla wag modeli i systemów szkoleniowych. Propozycja wspiera prawa dotyczące przejrzystości w stanach takich jak Kalifornia i Nowy Jork. Firma argumentowała jednak, że sama publiczna ujawnianie informacji nie odpowiada już szybkości rozwoju AI.
Proponowane zasady dotyczyłyby wyłącznie najbardziej zaawansowanych systemów AI. Anthropic ustalił próg dla modeli szkolonych powyżej 10²⁵ operacji zmiennoprzecinkowych. Ramy te obejmowałyby również firmy osiągające ponad 500 milionów dolarów przychodów związanych z AI. Podlegałyby im również firmy wydające ponad miliard dolarów na badania i rozwój AI.
Anthropic wymienił cztery główne obszary ryzyka w propozycji. Obejmują one ryzyko biologiczne, ryzyko cybernetyczne, utratę kontroli oraz zautomatyzowane badania AI. W przypadku ryzyka biologicznego firma ostrzegła, że niebezpieczne systemy mogą pomóc atakującym w rozwoju szkodliwych wirusów. Zauważyła również, że podobne narzędzia AI mogą wspierać odkrywanie leków.
W przypadku ryzyka cybernetycznego, modele graniczne mogą znajdować poważne luki w oprogramowaniu na dużą skalę. Anthropic stwierdził, że te możliwości budzą obawy o szpitale, sieci energetyczne i inne kluczowe systemy. Firma podkreśliła również ryzyka wynikające z działania systemów poza kontrolą dewelopera. Zautomatyzowane badania AI mogą zwiększyć ryzyko biologiczne, cybernetyczne i związane z kontrolą, jeśli zabezpieczenia zawiodą.
Anthropic chce, aby twórcy modeli granicznych publikowali regularne raporty ryzyka. Raporty te opisywałyby ogólną postawę dewelopera w zakresie ryzyka i prace nad bezpieczeństwem modelu. Ramy te przewidują również co najmniej jednego wykwalifikowanego niezależnego ewaluatora. Ewaluator ten przeglądałby oceny firmy i publikował wyniki w raportach ryzyka modelu.
Rządy i branża również ustaliłyby standardy dla tych ewaluatorów. Propozycja mówi, że ewaluatorzy potrzebują finansowania i dostępu do modeli granicznych. Zasady bezpieczeństwa stanowią kolejną ważną część ram. Deweloperzy chroniliby swoje pełne środowisko programistyczne przed zewnętrznymi atakującymi i zagrożeniami wewnętrznymi.
Firmy opisywałyby swoje programy bezpieczeństwa publicznie na wysokim poziomie. Dzieliłyby się również większą liczbą szczegółów z wyznaczoną agencją rządową na żądanie. Anthropic powiedział, że decydenci mogliby zacząć od lżejszych zasad i dostosowywać je w czasie. Ramy te mówią, że regulacje powinny podążać za możliwościami modeli i standardami oceny.
Druga część ram koncentruje się na odporności publicznej. Anthropic zalecił silniejsze planowanie w zakresie ryzyka biologicznego, cybernetycznego i związanego z kontrolą AI. W przypadku biologii propozycja obejmuje skrining syntezy genów i wczesne ostrzeganie w zakresie biosekurancji. Wspomina również o zapasach sprzętu ochronnego i narzędziach do zmniejszania transmisji drogą powietrzną.
W zakresie cyberbezpieczeństwa, ramy wzywają do wzmocnienia oprogramowania internetowego i wsparcia dla operatorów infrastruktury krytycznej. Zaleca również wymianę przestarzałych systemów w kluczowej infrastrukturze. Rządy powinny również śledzić możliwości cybernetyczne modeli granicznych poprzez dedykowaną funkcję. Anthropic zaproponował wspólną pracę rządu i przemysłu nad zabezpieczeniami modeli.
Firma stwierdziła, że prace nad ryzykiem utraty kontroli i zautomatyzowanych badań są mniej zaawansowane. Wezwała do opracowania lepszych narzędzi do wykrywania, powstrzymywania lub wyłączania niebezpiecznych systemów. Anthropic wezwał decydentów do działania, ponieważ możliwości modeli stale się poprawiają. Firma stwierdziła, że zarządzanie AI musi nadążać za technologią.