
Anthropic rozszerza dostęp do swojego modelu AI Claude Mythos poprzez Project Glasswing, program mający na celu umożliwienie firmom technologicznym, bezpieczeństwa i rządom odkrywania i naprawiania błędów oraz potencjalnych exploitów, zanim potężny model zostanie publicznie udostępniony.
We wtorek Anthropic poinformował w poście na blogu, że dodaje około 150 organizacji do swojego kontrolowanego programu, przygotowując się do szerszego udostępnienia kontrowersyjnego modelu.
Ekspansja następuje po tym, jak Anthropic zapowiedział, że spodziewa się udostępnić modele klasy Mythos klientom "w nadchodzących tygodniach", po wprowadzeniu dodatkowych zabezpieczeń. Wiadomość pojawia się również w momencie, gdy Anthropic przygotowuje się do wejścia na giełdę, po złożeniu w poniedziałek poufnego wniosku o IPO do amerykańskiej Komisji Papierów Wartościowych i Giełd.
„Po kilku tygodniach ścisłej współpracy z naszymi partnerami Project Glasswing, branżą bezpieczeństwa, twórcami oprogramowania open-source i rządem USA, rozszerzamy partnerstwo na około 150 nowych organizacji” – napisał Anthropic. „Każda z nich będzie musiała spełnić nasze wymagania bezpieczeństwa, zanim uzyska dostęp”.
Najnowsze rozszerzenie Project Glasswing obejmuje organizacje z sektorów infrastruktury krytycznej, w tym energetyki, wody, opieki zdrowotnej, komunikacji i sprzętu. Anthropic poinformował, że wiele z nowych organizacji utrzymuje oprogramowanie używane przez rządy i setki milionów ludzi.
„Wspólną cechą każdego partnera jest to, że udany atak na ich bazę kodu mógłby być katastrofalny” – napisał Anthropic. „W przypadku większości partnerów szacujemy, że poważny atak mógłby dotknąć ponad 100 milionów ludzi, z ważnymi konsekwencjami dla bezpieczeństwa globalnego i narodowego”.
Claude Mythos pojawił się publicznie w marcu po wycieku wstępnych materiałów Anthropic online. Według Anthropic, organizacje, które wcześniej uzyskały dostęp, już wykorzystały Mythos Preview do zidentyfikowania ponad 10 000 luk w oprogramowaniu o wysokim lub krytycznym stopniu zagrożenia. Partnerzy używają również modelu do pisania łatek, przeprowadzania audytów bezpieczeństwa i testowania oprogramowania przed wydaniem.
Możliwości modelu wzbudziły obawy wśród badaczy i agencji rządowych, że coraz bardziej zaawansowane systemy AI mogą ułatwiać przeprowadzanie cyberataków.
Brytyjski Instytut Bezpieczeństwa AI poinformował, że Mythos autonomicznie przeprowadził 32-etapowy symulowany atak na sieć korporacyjną podczas testów. Mozilla stwierdziła, że model zidentyfikował 271 luk, które zostały naprawione w przeglądarce internetowej Firefox, natomiast startup zabezpieczeniowy Calif twierdził, że wersja podglądowa pomogła badaczom opracować łańcuch exploitów celujący w chipy komputerowe Apple M5.
Anthropic stwierdził, że rozszerza dostęp do Mythos, ponieważ wierzy, że obrońcy potrzebują coraz bardziej zaawansowanych narzędzi AI, zanim atakujący uzyskają podobne możliwości. Firma podała, że spodziewa się, iż inni deweloperzy wydadzą modele klasy Mythos w ciągu sześciu do dwunastu miesięcy, potencjalnie bez porównywalnych zabezpieczeń, co zwiększa perspektywę częstszych i mniej przewidywalnych cyberataków.
„W przyszłości wydawanie modeli granicznych będzie niosło ze sobą coraz większe ryzyko. Możliwości będą nadal się poprawiać we wszystkich dziedzinach, w tym w wielu, które – podobnie jak cyberbezpieczeństwo – mogą wzmocnić zarówno atakujących, jak i obrońców” – napisał Anthropic. „Jeśli nam się uda, mamy nadzieję, że zapewnimy trwałą przewagę obrońcom”.
Anthropic nie odpowiedział natychmiast na prośbę o komentarz ze strony _Decrypt_.
Wraz z rozszerzonym prywatnym dostępem, użytkownicy Myriad – platformy rynków predykcyjnych obsługiwanej przez spółkę macierzystą _Decrypt_, Dastan – tracą zaufanie do tego, że Claude Mythos zostanie udostępniony publicznie do końca czerwca. Obecnie szacują prawdopodobieństwo na zaledwie 26,5%, w porównaniu do szczytowych 58,5% w zeszłym tygodniu.