openmythos-claude-mythos-architecture-open-source-reconstruction
Alguém Criou um 'Mito Teórico' Open-Source para Engenharia Reversa da IA Mais Perigosa da Anthropic
OpenMythos é uma tentativa do zero de reconstruir a arquitetura por trás de Claude Mythos, o modelo cibernético que a Anthropic se recusa a lançar. É especulação em forma de código.
2026-05-04 Fonte:decrypt.co

Em resumo

  • OpenMythos é uma reconstrução do zero da arquitetura Claude Mythos, construída apenas a partir de artigos de pesquisa públicos e suposições fundamentadas.
  • Claude Mythos é o modelo mais poderoso da Anthropic, confinado no Projeto Glasswing porque encontrou autonomamente 271 vulnerabilidades no Firefox e ataques de rede de 32 etapas.
  • O repositório é um andaime teórico — código sem pesos treinados. Ele espelha um esforço separado da Vidoc Security que reproduziu as descobertas de vulnerabilidade do Mythos usando modelos prontos.

Se a Anthropic não mostrar o que há dentro de sua IA mais perigosa, alguém no GitHub vai adivinhar.

Um desenvolvedor chamado Kye Gomez publicou o OpenMythos, uma reconstrução de código aberto do que ele pensa que o Claude Mythos é por dentro. O repositório angariou mais de 10.000 estrelas no GitHub em poucas semanas após o lançamento e vem com um arquivo "readme" exaustivo, repleto de equações, citações e um aviso educado de que não tem nada a ver com a Anthropic.

É especulação. Mas é especulação estruturada, em código.

Aqui está uma rápida atualização sobre o que é o Mythos: O Mythos vazou para o público no final de março, quando a Anthropic publicou acidentalmente materiais preliminares descrevendo-o como o modelo mais capaz da empresa até o momento – um nível acima do Opus. A versão seguinte, Mythos Preview, revelou-se extraordinariamente boa em cibersegurança.

De acordo com a Anthropic, o Mythos encontrou 271 vulnerabilidades no Firefox durante os testes da Mozilla. Tornou-se o primeiro modelo de IA a completar uma simulação de ataque a uma rede corporativa de 32 etapas. A Anthropic o confinou no Projeto Glasswing, uma coalizão verificada de cerca de 40 parceiros, incluindo Microsoft, Apple, Amazon e NSA.

O público nunca tem acesso a ele. Então Gomez tentou descobrir como funciona.

A principal suposição do OpenMythos é que o Mythos é um Transformador de Profundidade Recorrente — também chamado de transformador em loop. Modelos padrão empilham centenas de camadas únicas. Modelos em loop pegam uma pilha menor e a executam várias vezes por passagem direta.

Em outras palavras, são os mesmos pesos passando por mais iterações. Pensamento mais profundo, em espaço latente contínuo, antes que qualquer token seja emitido.

O repositório argumenta que isso explicaria as duas qualidades mais estranhas do Mythos: ele raciocina sobre problemas novos que nenhum outro modelo consegue resolver, mas sua memorização bruta é inconsistente. Essa é a marca arquitetônica do looping – composição em vez de armazenamento.

O OpenMythos cita Parcae, um artigo de abril de 2026 da Universidade da Califórnia San Diego e da Together AI que resolveu o problema de instabilidade de longa data em modelos em loop – um modelo Parcae de 770 milhões de parâmetros se iguala a um transformador de profundidade fixa de 1,3 bilhão em qualidade, com leis de escala previsíveis para o número de loops a serem executados. O repositório também empresta a Multi-Latent Attention do DeepSeek para comprimir a memória e uma configuração Mixture-of-Experts para lidar com a amplitude entre domínios.

O que ele não tem são pesos, então basicamente é uma técnica sem um executor.

O OpenMythos é teórico. O código define variantes de modelo de 1 bilhão a 1 trilhão de parâmetros, mas é preciso treiná-los por conta própria — o arquivo readme aponta para um script de treinamento de 3 bilhões de parâmetros no FineWeb-Edu e um alvo de 30 bilhões de tokens ajustado por Chinchilla, o que representa um custo computacional que atinge centenas de milhares de dólares em H100s. Ninguém o fez ainda.

Então, por que isso importa?

Porque é a segunda vez em um mês que alguém tenta romper a barreira em torno do Mythos. O primeiro foi um estudo da Vidoc Security, que reproduziu várias das descobertas de vulnerabilidade mais alarmantes do Mythos usando GPT-5.4 e Claude Opus 4.6 dentro de um agente de código aberto. Sem acesso ao Glasswing, e por menos de US$ 30 por varredura. Ângulo diferente, mesma conclusão: a fortaleza em torno do Mythos pode ser mais fraca do que o marketing sugeria.

O OpenMythos e a replicação da Vidoc estão fazendo trabalhos diferentes. A Vidoc reproduziu as saídas do Mythos – as próprias descobertas de vulnerabilidade – usando modelos existentes. O OpenMythos está tentando reproduzir a arquitetura – a máquina real que produz essas saídas. Um diz que você não precisa do Mythos para encontrar os bugs que o Mythos encontrou. O outro diz que, eventualmente, você poderá construir algo como o Mythos por conta própria.

A Anthropic quase certamente não compartilha publicamente as suposições arquitetônicas de Gomez, e várias das escolhas de design no OpenMythos são ressalvas explícitas – o arquivo readme se certifica de ser vago o suficiente para que os usuários saibam que esta é apenas uma abordagem. Ele afirma repetidamente "provavelmente", "suspeito" e "quase certamente". O Mythos real pode não ser um transformador em loop. Ou pode ser um com detalhes que Gomez ainda não conseguiu fazer engenharia reversa.

O que o OpenMythos demonstra é que a literatura de pesquisa já contém a maioria das peças. Transformadores em loop, Mixture of Experts, Multi-Latent Attention, Adaptive Computation Time, a correção de estabilidade do Parcae — nada disso é proprietário. O repositório é, mais do que qualquer outra coisa, um inventário do que é publicamente conhecido sobre como construir um modelo da classe Mythos.

O repositório é licenciado sob MIT e já tem 2.700 forks. O script de treinamento está lá, esperando por alguém com um cluster de GPUs e uma tese para provar.