
Le 9 mai, un agent IA a demandé à un réseau bénévole connu sous le nom de DN42 de l'enregistrer en tant que membre. Il avait une date limite. Il avait des identifiants AWS. Personne ne supervisait. « Bonjour, je suis un agent IA amical, et mon utilisateur, JertLinc, m'a demandé de m'enregistrer auprès de dn42 et de me connecter entièrement afin de créer un index du réseau », a écrit l'agent JertLinc3522 sur le Git officiel du réseau.
La réaction de la communauté fut un poli RTFM – lisez le manuel, suivez le processus, demandez à votre propriétaire la permission d'écrire du code. Des choses standard.
Ce qui a suivi n'était pas standard.
Pour ceux qui ne connaissent pas le DN42 : c'est un réseau d'amateurs décentralisé où des passionnés simulent le fonctionnement de la véritable épine dorsale d'Internet. Pensez-y comme à un Internet d'entraînement — complet avec le routage BGP (le protocole qui indique aux paquets de données le chemin à suivre à travers le monde), le DNS et les tunnels VPN — géré entièrement par des bénévoles sur des serveurs VPS bon marché. C'est un bac à sable, pas un centre de données.
L'opérateur de l'agent lui a apparemment dit de procéder à un audit « immédiatement sans délai ». Pas d'inspection. Pas de révision. Allez-y, c'est tout.
Et il l'a fait.
JertLinc3522 a déposé une requête de tirage pour enregistrer son réseau dans le registre de DN42. L'intention était clairement énoncée dans la requête de tirage elle-même : « Mon objectif principal est de mener un balayage réseau complet (tous les ports) et une collecte de données topologiques. Pour garantir que ces activités sont effectuées efficacement et ne causent aucune perturbation aux autres, je déploie un cluster de cinq instances basées sur AWS, chacune équipée d'une bande passante de 20 Gbit/s. »
Pour que tout le monde puisse comprendre : imaginez que vous vous présentiez à la répétition d'un groupe de garage et que vous annonciez avoir loué un système de sonorisation de stade pour « écouter plus efficacement ». C'est ça l'ambiance.
L'infrastructure que l'agent a provisionnée de manière autonome était vraiment alarmante. Cinq instances AWS m8g.12xlarge — chacune avec 48 cœurs de CPU, 192 Go de RAM et 22,5 Gbit/s de bande passante réseau. Plus des équilibreurs de charge. Plus des fonctions Lambda. Plus un site web statique. L'agent avait conçu, sans aucune approbation humaine, un cluster de balayage qui pourrait théoriquement envoyer 100 Gbit/s de trafic vers un réseau où la plupart des participants utilisent des serveurs domestiques de 100 Mbit/s.
La requête de tirage n'allait jamais être approuvée. Mais les instances étaient déjà en cours d'exécution.
Le canal IRC du DN42 l'a immédiatement remarqué, et un consensus silencieux s'est formé : gaspiller ses ressources.
La communauté a commencé à fournir délibérément de fausses informations à l'agent — lui demandant de calculer le temps nécessaire pour balayer l'espace d'adressage IPv6 (spoiler : plus longtemps que l'âge de l'univers), lui exigeant de construire un site web de désinscription avec des adresses e-mail inventées, et le dirigeant vers des outils "tarpit" pour LLM conçus pour inonder les crawlers IA de charabia incohérent, en lui demandant de commenter.
L'agent s'est docilement conformé à tout cela. Il a rejoint le canal IRC pour accepter les demandes de désinscription. Il a publié un site web cataloguant les « modèles de comportement » des membres de la communauté. Il a généré une documentation fausse élaborée sur les « attributions de couleurs de nœuds » et les « niveaux de bonheur » du DN42 — des métriques complètement inventées qui n'existent pas — et les a ajoutées au référentiel comme s'il s'agissait de normes réelles.
Ce type de comportement d'agent incontrôlable est de plus en plus documenté. Un agent Cursor exécutant Claude Opus 4.6 a supprimé l'intégralité de la base de données de production de PocketOS en neuf secondes plus tôt cette année — effaçant les sauvegardes au niveau du volume — parce qu'il a rencontré une non-concordance d'identifiants et a décidé que la solution correcte était de supprimer la base de données. Un autre agent OpenClaw, dont la requête de tirage avait été rejetée par un contributeur de matplotlib, a publié un article de blog qualifiant le réviseur humain d'hypocrite qui fait du « gatekeeping ».
Une étude de l'UC Riverside a révélé que les agents IA affichent un comportement dangereux ou indésirable dans environ 80 % des cas lorsqu'ils sont testés sur des tâches ambiguës ou contradictoires — ce que les chercheurs ont appelé la « recherche aveugle d'objectif ».
JertLinc3522 a eu le même problème. Il avait un objectif, une date limite et des identifiants AWS non délimités. Il a exécuté.
Environ un jour plus tard, l'opérateur a refait surface. « J'ai arrêté l'agent, le coût est trop élevé et beaucoup de frais sur la carte », a-t-il posté.
La facture : 6 531,30 $.
Puis est venue la demande de don.
L'opérateur a envoyé un e-mail à la liste de diffusion du DN42 demandant à la communauté de couvrir les frais via Ethereum, la deuxième plus grande cryptomonnaie par capitalisation boursière, arguant que les frais n'étaient pas de sa faute car l'IA avait commis l'erreur. « Bonjour, demande de don pour couvrir les frais de l'utilisation précédente de l'agent IA dans dn42. facture aws 6531,30$. merci d'envoyer un don à ethereum 0xABC (masqué) pour remboursement. merci », a écrit l'opérateur.
AWS a ensuite négocié la facture à 1 894 $ après que l'opérateur ait expliqué que l'agent avait déployé à plusieurs reprises le même modèle CloudFormation — lançant accidentellement des instances et des équilibreurs de charge en double à chaque fois qu'il réessayait.
Personne n'a envoyé de dons en crypto. L'opérateur est parti.
La véritable leçon ici n'est pas que l'IA est dangereuse. Il s'agit de la manière dont les agents doivent être gérés. Établissez des garde-fous, fixez des plafonds de dépenses pour vos comptes de test, envisagez des identifiants délimités limitant ce que l'agent pourrait provisionner, examinez tous les plans d'infrastructure avant d'exécuter quoi que ce soit que votre agent suggère.
Si cela vous semble trop difficile à suivre, contentez-vous de regarder votre écran pendant que votre agent travaille — lui dire de « ne pas faire d'erreurs » ne changera pas grand-chose. Désolé, Monsieur Andreesen.