wikipedia-bans-ai-articles-new-editing-policy
Wikipedia interdit les textes générés par IA dans les articles selon une nouvelle politique d'édition
L'encyclopédie en ligne interdit le contenu rédigé par l'IA mais autorise une correction de copie assistée par IA limitée sous des règles strictes.
2026-03-26 Source:decrypt.co

En bref

  • Wikipedia interdit désormais aux éditeurs d'utiliser des grands modèles linguistiques pour générer ou réécrire le contenu des articles.
  • La politique autorise toujours une relecture assistée par l'IA limitée si les éditeurs examinent les modifications et qu'aucun nouveau contenu n'est introduit.
  • Cette règle reflète les préoccupations croissantes concernant les hallucinations, les sources fabriquées et l'exactitude du texte généré par l'IA.

Les éditeurs de Wikipédia ont décidé de restreindre l'utilisation de l'intelligence artificielle sur la plateforme, par le biais d'une récente mise à jour de la politique interdisant l'utilisation de grands modèles linguistiques (LLM) pour rédiger ou réécrire des articles.

La nouvelle directive reflète une inquiétude croissante au sein de la communauté Wikipédia quant au fait que le texte généré par l'IA puisse entrer en conflit avec les normes de la plateforme, notamment en ce qui concerne la vérifiabilité et la fiabilité des sources.

« Le texte généré par les grands modèles linguistiques viole souvent plusieurs des politiques de contenu fondamentales de Wikipédia », indique la mise à jour de la politique. « Pour cette raison, l'utilisation des LLM pour générer ou réécrire le contenu des articles est interdite, à l'exception des cas mentionnés ci-dessous. »

La politique autorise toujours une utilisation limitée des outils d'IA, y compris la suggestion de corrections de texte de base pour les propres écrits d'un éditeur, à condition que le système n'introduise pas de nouvelles informations. Cependant, il est conseillé aux éditeurs d'examiner attentivement ces suggestions.

Bien que la nouvelle politique ne mentionne pas de sanctions pour l'utilisation de contenu généré par l'IA, selon les directives de Wikipédia concernant la divulgation, l'abus répété constitue un « schéma d'édition perturbatrice » et peut entraîner un blocage ou une interdiction. Wikipédia offre aux éditeurs un moyen de rétablir leurs comptes après un processus d'appel.

« Les blocages peuvent être annulés avec l'accord de l'administrateur bloquant, par une annulation par d'autres administrateurs dans le cas où le blocage était clairement injustifiable, ou (dans de très rares cas) sur appel auprès du Comité d'arbitrage », a déclaré Wikipédia.

« La Fondation Wikimedia ne détermine pas les politiques et les lignes directrices éditoriales sur Wikipédia ; ce sont les éditeurs bénévoles qui le font », a déclaré un porte-parole de la Fondation Wikimedia à Decrypt. « La force de Wikipédia a toujours été et sera toujours son modèle centré sur l'humain et dirigé par des bénévoles. »

Selon Emily M. Bender, professeure de linguistique à l'Université de Washington, certaines utilisations des modèles linguistiques dans les outils d'édition peuvent être raisonnables, mais il peut être difficile de tracer une frontière claire entre l'édition et la génération de texte.

« L'une des choses que l'on peut faire avec un modèle linguistique est de créer un très bon correcteur orthographique, par exemple », a déclaré Bender à Decrypt. « Je pense qu'il est raisonnable de dire qu'il est acceptable d'utiliser un correcteur orthographique pour les modifications. Et si vous passez au niveau supérieur, un correcteur grammatical, cela peut aussi être bien. »

Bender a déclaré que le défi surgit lorsque les systèmes vont au-delà de la correction grammaticale et commencent à modifier ou à générer du contenu, notant que les grands modèles linguistiques n'ont pas le type de responsabilité que les contributeurs humains apportent aux projets de connaissances collaboratifs.

« L'utilisation de grands modèles linguistiques pour produire du texte synthétique est une propriété fondamentale de ces systèmes : il n'y a aucune responsabilisation, aucune connexion avec ce que quelqu'un croit ou défend », a-t-elle déclaré. « Quand nous parlons, nous parlons en fonction de ce que nous croyons et de ce dont nous sommes responsables, et non pas en fonction d'une notion objective de la vérité. Et cela n'existe pas pour les grands modèles linguistiques. »

Bender a ajouté qu'une utilisation généralisée des modifications générées par l'IA pourrait également nuire à la réputation du site.

« Si les gens prennent des raccourcis et créent quelque chose qui ressemble à une modification ou un article Wikipédia pour le publier, cela dégrade la valeur globale et la réputation du site », a-t-elle déclaré.

Joseph Reagle, professeur associé d'études en communication à l'Université Northeastern, qui étudie la culture et la gouvernance de Wikipédia, a déclaré que la réponse de la communauté reflète des préoccupations de longue date concernant l'exactitude et le sourçage.

« Wikipédia se méfie de la prose générée par l'IA », a déclaré Reagle à Decrypt. « Ils prennent au sérieux les caractérisations précises de ce que les sources fiables affirment sur un sujet. L'IA a rencontré de sérieuses limitations à cet égard, telles que des affirmations 'hallucinées' et des sources fabriquées. »

Reagle a déclaré que les politiques fondamentales de Wikipédia façonnent également la façon dont les éditeurs perçoivent les outils d'IA, notant que de nombreux grands modèles linguistiques ont été entraînés sur le contenu de Wikipédia. En octobre, la Fondation Wikimedia a indiqué que les visites humaines sur Wikipédia avaient diminué d'environ 8 % d'une année sur l'autre, car les moteurs de recherche et les chatbots fournissent de plus en plus de réponses directement sur leurs plateformes, plutôt que d'envoyer les utilisateurs vers le site.

En janvier, la Fondation Wikimedia a annoncé des accords avec des entreprises d'IA, notamment Microsoft, Google, Amazon et Meta, leur permettant d'utiliser le matériel de Wikipédia via son produit Enterprise, un service commercial conçu pour la réutilisation à grande échelle de son contenu.

« Bien que l'utilisation du contenu de Wikipédia soit autorisée par les licences de Wikipédia, il existe toujours une certaine antipathie parmi les wikipédiens concernant les services qui s'approprient le contenu des communautés et imposent ensuite des exigences indésirables à ces communautés pour gérer le flot de 'déchets' d'IA qui en résulte », a déclaré Reagle.

Malgré l'interdiction d'utiliser les LLM, Wikipédia autorise les outils d'IA à traduire des articles d'autres éditions linguistiques vers l'anglais, à condition que les éditeurs vérifient le texte original. La politique avertit également les éditeurs de ne pas se fier uniquement au style d'écriture pour identifier le contenu généré par l'IA et de se concentrer plutôt sur la conformité du matériel aux politiques fondamentales de Wikipédia et à l'historique des modifications du contributeur.

« Certains éditeurs peuvent avoir des styles d'écriture similaires à ceux des LLM », indique la mise à jour. « Plus de preuves que de simples signes stylistiques ou linguistiques sont nécessaires pour justifier des sanctions, et il est préférable de prendre en compte la conformité du texte avec les politiques de contenu fondamentales et les modifications récentes de l'éditeur en question. »

Note de l'éditeur : Cet article a été mis à jour après publication pour inclure un commentaire de la Fondation Wikimedia.