InicioCentro de noticias de LBank
Anthropic está ayudando a la NSA a hackear China. También quiere que todos pausen la IA
anthropic-helping-nsa-hack-china-also-wants-everyone-pause-ai
Anthropic está ayudando a la NSA a hackear China. También quiere que todos pausen la IA
La empresa detrás de Claude incrustó ingenieros en la NSA para operaciones cibernéticas ofensivas, luego publicó un informe advirtiendo que la IA pronto podría auto-construirse sin intervención humana.
2026-06-05 Fuente:decrypt.co

En resumen

  • Según se informa, Anthropic ha integrado aproximadamente media docena de ingenieros en la NSA para desplegar su modelo de IA Mythos en operaciones cibernéticas ofensivas, lo que podría incluir ataques a redes en China e Irán.
  • Anthropic también advirtió que la IA se acerca a la auto-mejora recursiva y pidió un mecanismo coordinado de pausa global.
  • Ambas noticias surgen mientras Anthropic presenta una OPI que podría valorarla en más de 1 billón de dólares.


Anthropic ha desplegado a unos seis ingenieros dentro de la Agencia de Seguridad Nacional (NSA) para ayudar a implementar Mythos —su modelo de IA más potente— en operaciones cibernéticas ofensivas, informó el Financial Times el jueves.

Los ingenieros son personal desplegado en avanzada, que personalizan el modelo para aplicaciones específicas. Una fuente declaró al FT que podría ser útil para infiltrarse en redes de países como China e Irán.

No está confirmado si esos ingenieros están involucrados en operaciones activas. Lo que sí se sabe es que Mythos es el mismo modelo que Anthropic se ha negado a lanzar públicamente, citando el riesgo de uso indebido. La compañía lo limitó a socios verificados a través del Proyecto Glasswing, una coalición restringida que incluye a Microsoft, Apple y Amazon.

Anthropic también está demandando al Pentágono. A finales de febrero, el Secretario de Defensa, Pete Hegseth, designó a la compañía como un riesgo para la cadena de suministro —una etiqueta históricamente reservada para adversarios extranjeros como Huawei— después de que un contrato de 200 millones de dólares colapsara. El punto de conflicto: Anthropic se negó a permitir que el Departamento de Defensa (DoD) usara Claude para armas totalmente autónomas o vigilancia masiva doméstica. El contrato de la NSA estuvo exento de esa prohibición.

Un juez de California bloqueó la inclusión en la lista negra como una aparente represalia de la Primera Enmienda. Un tribunal de apelaciones de D.C. denegó la solicitud de Anthropic de detenerla mientras el litigio se desarrolla. La NSA siguió utilizando Mythos todo el tiempo, según los informes del FT.

Cómo detener la IA que construye IA

El mismo día en que se dio a conocer la noticia sobre la NSA, el instituto de investigación interno de Anthropic publicó "When AI Builds Itself" (Cuando la IA se construye a sí misma), un análisis sobre cuánto ha avanzado Claude en la automatización de su propio desarrollo. En este, la compañía aboga esencialmente por una moratoria global en la carrera armamentista de la IA, e incluso la comparó con los tratados nucleares de la Guerra Fría firmados entre Estados Unidos y Rusia.

Para entender por qué, la compañía proporcionó este contexto:

Claude ahora escribe más del 80% del código fusionado en la base de código de producción de Anthropic, un aumento significativo desde los dígitos bajos antes del lanzamiento de Claude Code a principios de 2025. Los ingenieros entregan aproximadamente ocho veces más código por día de lo que lo hacían en 2024.

Los autores del informe —Marina Favaro, directora del Anthropic Institute, y Jack Clark, cofundador— sostienen que esta trayectoria se dirige hacia lo que ellos denominan auto-mejora recursiva: sistemas de IA que diseñan, construyen y entrenan de forma autónoma a sus propios sucesores, con los humanos desempeñando un papel cada vez menor en cada paso.

En una representación visual, los investigadores muestran una línea de tiempo en la que la primera forma de usar la IA en el trabajo es que los humanos solicitan al ordenador un resultado, con automatizaciones crecientes que terminan en Agentes de IA solicitando a subagentes hasta que se logra el resultado, sin intervención humana.

El dato más impactante que citan: en abril, los agentes de Claude recibieron un problema abierto de seguridad de IA —si un modelo más débil puede supervisar de forma fiable a uno más fuerte— y se les permitió ejecutarlo. Dos investigadores humanos, durante aproximadamente una semana, recuperaron el 23% de la brecha de rendimiento entre los modelos. Los agentes recuperaron el 97%, en más de 800 horas de cálculo acumuladas. Los humanos establecieron la pregunta. Los agentes diseñaron cada experimento. Es el primer caso publicado de Claude ejerciendo juicio de investigación, no solo ejecutando tareas especificadas por otros.

Esa es la línea que a Anthropic le preocupa cruzar. Una vez que la IA elige qué experimentos vale la pena ejecutar —no solo los ejecuta— los humanos pierden el último papel significativo en el ciclo de desarrollo. Pequeñas desalineaciones visibles en los modelos actuales podrían agravarse a través de generaciones de auto-mejora hasta que nadie pueda corregirlas.

Su solución propuesta es una pausa global verificable: múltiples laboratorios de vanguardia deteniéndose simultáneamente, con verificación independiente de que todos realmente se detuvieron. Anthropic afirmó que se uniría a una. Una desaceleración unilateral, reconocen, simplemente entrega la delantera a quien siguió adelante.

Ya hemos visto esta película antes. Los laboratorios que construyen IA son los mismos que advierten lo peligrosa que es la IA. Sin embargo, la IA es el negocio más rentable de la década, por lo que nadie quiere detenerse, ni siquiera los que advierten sobre ella.

En 2023, más de cien figuras destacadas de la comunidad de investigación de IA firmaron una carta abierta pidiendo un esfuerzo global para mitigar el riesgo de extinción que intrínsecamente conlleva el desarrollo de la IA. Unos meses antes, otra carta abierta exigía a OpenAI que detuviera los avances de ChatGPT debido a su naturaleza peligrosa.

Nadie se detuvo después de la carta abierta de 2023. OpenAI no lo hizo. Anthropic tampoco. La fecha límite del Pentágono para eliminar a Claude de sus sistemas es en agosto, aproximadamente al mismo tiempo que se espera que la OPI de Anthropic ponga sus finanzas a la vista pública.