
Os editores da Wikipedia decidiram restringir o uso da inteligência artificial na plataforma, numa recente atualização da política que proíbe o uso de modelos de linguagem grandes para escrever ou reescrever artigos.
A nova diretriz reflete a crescente preocupação na comunidade Wikipedia de que o texto gerado por IA pode conflitar com os padrões da plataforma, particularmente em relação à verificabilidade e fontes fiáveis.
“O texto gerado por modelos de linguagem grandes frequentemente viola várias das políticas de conteúdo centrais da Wikipedia”, lê-se na atualização da política. “Por esta razão, o uso de LLMs para gerar ou reescrever conteúdo de artigos é proibido, exceto pelas exceções indicadas abaixo.”
A política ainda permite o uso limitado de ferramentas de IA, incluindo a sugestão de edições de texto básicas para a própria escrita de um editor, desde que o sistema não introduza novas informações. No entanto, os editores são aconselhados a revisar essas sugestões cuidadosamente.
Embora a nova política não mencione penalidades para o uso de conteúdo gerado por IA, de acordo com as diretrizes da Wikipedia sobre divulgação, a má utilização repetida constitui um “padrão de edição disruptiva” e pode levar a um bloqueio ou banimento. A Wikipedia oferece aos editores um caminho para reativar suas contas após um processo de apelação.
“Bloqueios podem ser revertidos com o acordo do administrador que efetuou o bloqueio, uma anulação por outros administradores caso o bloqueio tenha sido claramente injustificável, ou (em casos muito raros) mediante recurso ao Comitê de Arbitragem”, disse a Wikipedia.
"A Fundação Wikimedia não determina as políticas e diretrizes editoriais na Wikipedia; são os editores voluntários que o fazem", disse um porta-voz da Fundação Wikimedia ao Decrypt. "A força da Wikipedia tem sido e sempre será o seu modelo centrado no ser humano e impulsionado por voluntários."
De acordo com Emily M. Bender, professora de linguística na Universidade de Washington, alguns usos de modelos de linguagem em ferramentas de edição podem ser razoáveis, mas traçar uma linha clara entre editar e gerar texto pode ser difícil.
“Então, uma das coisas que você pode fazer com um modelo de linguagem é construir um corretor ortográfico muito bom, por exemplo”, disse Bender ao Decrypt. “Acho razoável dizer que não há problema em usar um corretor ortográfico nas edições. E se você estiver fazendo o próximo nível, um corretor gramatical, isso também pode ser aceitável.”
Bender disse que o desafio surge quando os sistemas vão além da correção gramatical e começam a alterar ou gerar conteúdo, observando que os modelos de linguagem grandes carecem do tipo de responsabilidade que os colaboradores humanos trazem para projetos de conhecimento colaborativo.
“Usar modelos de linguagem grandes para produzir texto sintético, é uma propriedade fundamental desses sistemas que não há responsabilidade, nenhuma conexão com o que alguém acredita ou defende”, disse ela. “Quando falamos, falamos com base no que acreditamos e pelo que somos responsáveis, não com base em alguma noção objetiva de verdade. E isso não existe para modelos de linguagem grandes.”
Bender disse que o uso generalizado de edições geradas por IA também poderia afetar a reputação do site.
“Se as pessoas estão, em vez disso, a procurar atalhos e a fazer algo que parece uma edição ou artigo da Wikipedia e a colocá-lo lá, então isso degrada o valor e a reputação geral do site”, disse ela.
Joseph Reagle, professor associado de estudos de comunicação na Northeastern University, que estuda a cultura e a governança da Wikipedia, disse que a resposta da comunidade reflete preocupações antigas sobre precisão e fontes.
“A Wikipedia está cautelosa com a prosa gerada por IA”, disse Reagle ao Decrypt. “Eles levam a sério as caracterizações precisas do que fontes fiáveis afirmam sobre um tópico. A IA tem tido sérias limitações nesse aspeto, como alegações ‘alucinadas’ e fontes fabricadas.”
Reagle disse que as políticas centrais da Wikipedia também moldam como os editores veem as ferramentas de IA, observando que muitos modelos de linguagem grandes foram treinados com conteúdo da Wikipedia. Em outubro, a Fundação Wikimedia disse que as visitas humanas à Wikipedia caíram cerca de 8% ano a ano, à medida que os motores de busca e chatbots fornecem cada vez mais respostas diretamente nas suas plataformas, em vez de enviar os utilizadores para o site.
Em janeiro, a Fundação Wikimedia anunciou acordos com empresas de IA, incluindo Microsoft, Google, Amazon e Meta, permitindo-lhes usar material da Wikipedia através do seu produto Enterprise, um serviço comercial projetado para a reutilização em larga escala do seu conteúdo.
“Embora o uso do conteúdo da Wikipedia seja permitido pelas licenças da Wikipedia, ainda há alguma antipatia entre os wikipedistas em relação a serviços que se apropriam do conteúdo de comunidades e depois impõem demandas indesejadas a essas comunidades para lidar com o consequente excesso de conteúdo de baixa qualidade gerado por IA”, disse Reagle.
Apesar da proibição de usar LLMs, a Wikipedia permite que ferramentas de IA traduzam artigos de outras edições de idiomas para o inglês, desde que os editores verifiquem o texto original. A política também alerta os editores para não confiarem apenas no estilo de escrita para identificar conteúdo gerado por IA e, em vez disso, concentrarem-se em se o material está em conformidade com as políticas centrais da Wikipedia e o histórico de edições do contribuinte.
“Alguns editores podem ter estilos de escrita semelhantes aos dos LLMs”, diz a atualização. “Mais evidências do que apenas sinais estilísticos ou linguísticos são necessárias para justificar sanções, e é melhor considerar a conformidade do texto com as políticas de conteúdo centrais e as edições recentes do editor em questão.”
Nota do Editor: Este artigo foi atualizado após a publicação para incluir um comentário da Fundação Wikipedia.