Agregacja tagów wiadomości krypto i treści tematycznych

anthropic-proposes-legal-powers-to-stop-high-risk-ai

Anthropic proponuje uprawnienia prawne do wstrzymania uruchomień sztucznej inteligencji wysokiego ryzyka

Anthropic zaproponował nowe ramy polityki AI obejmujące bezpieczeństwo modeli granicznych i przygotowanie gospodarcze. Ramy te wzywają do przyznania rządom uprawnień do blokowania lub odstraszania niebezpiecznych wdrożeń AI. Anthropic postuluje niezależne testy, silniejsze zasady bezpieczeństwa oraz plany zwiększania odporności na ryzyka związane ze sztuczną inteligencją.

2026-06-10 Źródło:crypto.news

Bezpieczeństwo AI

Anthropic zaproponował nowe ramy polityki AI w miarę jak zaawansowane systemy zyskują coraz większe możliwości.

Streszczenie

Anthropic zaproponował nowe ramy polityki AI, obejmujące bezpieczeństwo modeli granicznych oraz przygotowanie gospodarcze.
Ramy te wzywają do przyznania rządom uprawnień do blokowania lub powstrzymywania niebezpiecznych wdrożeń AI.
Anthropic chce niezależnych testów, silniejszych zasad bezpieczeństwa oraz planów odporności na ryzyka związane z AI.

Firma chce, aby rządy ustaliły zasady dotyczące modeli granicznych i przygotowały pracowników na wpływ AI na gospodarkę. Jej plan obejmuje niebezpieczne wdrożenia, niezależne testowanie, cyberbezpieczeństwo i odporność publiczną.

Anthropic dąży do silniejszych uprawnień w zakresie bezpieczeństwa AI

Anthropic przedstawił dwie propozycje w ramach swojego planu „Polityka w sprawie wykładniczego wzrostu AI”. Zaawansowane Ramy AI koncentrują się na potężnych modelach, natomiast Ramy Polityki Gospodarczej odnoszą się do pracowników i wspólnych korzyści finansowych. Firma argumentowała, że AI rozwija się obecnie szybciej niż obecne systemy kształtowania polityki. Stwierdziła również, że rządy potrzebują uprawnień do blokowania lub powstrzymywania niebezpiecznych wdrożeń modeli.

Zgodnie z planem, kary cywilne byłyby powiązane z globalnymi rocznymi przychodami. Powtarzające się naruszenia skutkowałyby wyższymi karami, zgodnie z proponowanymi ramami. Ramy te wzywają również twórców modeli granicznych do testowania modeli przed ich wydaniem. Twórcy publikowaliby streszczenia, ramy bezpieczeństwa i karty systemowe dla potężnych systemów AI.

Niezależni ewaluatorzy przeglądaliby testy modeli i raporty ryzyka. Anthropic chce również, aby deweloperzy utrzymywali silne programy bezpieczeństwa dla wag modeli i systemów szkoleniowych. Propozycja wspiera prawa dotyczące przejrzystości w stanach takich jak Kalifornia i Nowy Jork. Firma argumentowała jednak, że sama publiczna ujawnianie informacji nie odpowiada już szybkości rozwoju AI.

Ramy te koncentrują się na katastrofalnych zagrożeniach AI

Proponowane zasady dotyczyłyby wyłącznie najbardziej zaawansowanych systemów AI. Anthropic ustalił próg dla modeli szkolonych powyżej 10²⁵ operacji zmiennoprzecinkowych. Ramy te obejmowałyby również firmy osiągające ponad 500 milionów dolarów przychodów związanych z AI. Podlegałyby im również firmy wydające ponad miliard dolarów na badania i rozwój AI.

Anthropic wymienił cztery główne obszary ryzyka w propozycji. Obejmują one ryzyko biologiczne, ryzyko cybernetyczne, utratę kontroli oraz zautomatyzowane badania AI. W przypadku ryzyka biologicznego firma ostrzegła, że niebezpieczne systemy mogą pomóc atakującym w rozwoju szkodliwych wirusów. Zauważyła również, że podobne narzędzia AI mogą wspierać odkrywanie leków.

W przypadku ryzyka cybernetycznego, modele graniczne mogą znajdować poważne luki w oprogramowaniu na dużą skalę. Anthropic stwierdził, że te możliwości budzą obawy o szpitale, sieci energetyczne i inne kluczowe systemy. Firma podkreśliła również ryzyka wynikające z działania systemów poza kontrolą dewelopera. Zautomatyzowane badania AI mogą zwiększyć ryzyko biologiczne, cybernetyczne i związane z kontrolą, jeśli zabezpieczenia zawiodą.

Deweloperzy stoją przed obowiązkami testowania i bezpieczeństwa

Anthropic chce, aby twórcy modeli granicznych publikowali regularne raporty ryzyka. Raporty te opisywałyby ogólną postawę dewelopera w zakresie ryzyka i prace nad bezpieczeństwem modelu. Ramy te przewidują również co najmniej jednego wykwalifikowanego niezależnego ewaluatora. Ewaluator ten przeglądałby oceny firmy i publikował wyniki w raportach ryzyka modelu.

Rządy i branża również ustaliłyby standardy dla tych ewaluatorów. Propozycja mówi, że ewaluatorzy potrzebują finansowania i dostępu do modeli granicznych. Zasady bezpieczeństwa stanowią kolejną ważną część ram. Deweloperzy chroniliby swoje pełne środowisko programistyczne przed zewnętrznymi atakującymi i zagrożeniami wewnętrznymi.

Firmy opisywałyby swoje programy bezpieczeństwa publicznie na wysokim poziomie. Dzieliłyby się również większą liczbą szczegółów z wyznaczoną agencją rządową na żądanie. Anthropic powiedział, że decydenci mogliby zacząć od lżejszych zasad i dostosowywać je w czasie. Ramy te mówią, że regulacje powinny podążać za możliwościami modeli i standardami oceny.

Propozycja zawiera środki odporności

Druga część ram koncentruje się na odporności publicznej. Anthropic zalecił silniejsze planowanie w zakresie ryzyka biologicznego, cybernetycznego i związanego z kontrolą AI. W przypadku biologii propozycja obejmuje skrining syntezy genów i wczesne ostrzeganie w zakresie biosekurancji. Wspomina również o zapasach sprzętu ochronnego i narzędziach do zmniejszania transmisji drogą powietrzną.

W zakresie cyberbezpieczeństwa, ramy wzywają do wzmocnienia oprogramowania internetowego i wsparcia dla operatorów infrastruktury krytycznej. Zaleca również wymianę przestarzałych systemów w kluczowej infrastrukturze. Rządy powinny również śledzić możliwości cybernetyczne modeli granicznych poprzez dedykowaną funkcję. Anthropic zaproponował wspólną pracę rządu i przemysłu nad zabezpieczeniami modeli.

Firma stwierdziła, że prace nad ryzykiem utraty kontroli i zautomatyzowanych badań są mniej zaawansowane. Wezwała do opracowania lepszych narzędzi do wykrywania, powstrzymywania lub wyłączania niebezpiecznych systemów. Anthropic wezwał decydentów do działania, ponieważ możliwości modeli stale się poprawiają. Firma stwierdziła, że zarządzanie AI musi nadążać za technologią.

Najczęściej czytane

Przeciętny inwestor IBIT notuje obecnie stratę około 40%, gdy spotowe ETF-y Bitcoina zamykają drugi najgorszy tydzień w historii

11 godzin temu

Kalshi trafia w centrum uwagi Mistrzostw Świata FIFA dzięki umowie z ADI Predictstreet

2 dni temu

Galaxy Digital obniża prognozy dla CLARITY Act, gdy zegar Senatu tyka do końca

2 dni temu

Inne artykuły

SecondFi wyznacza ścieżkę odzyskania po exploitie portfela Cardano o wartości 2,4 miliona dolarów, zamierza zwrócić środki w ciągu dwóch tygodni

4 godzin temu

Przeciętny inwestor IBIT notuje obecnie stratę około 40%, gdy spotowe ETF-y Bitcoina zamykają drugi najgorszy tydzień w historii

11 godzin temu