
Los editores de Wikipedia han tomado medidas para restringir cómo se puede usar la inteligencia artificial en la plataforma, en una reciente actualización de política que prohíbe el uso de modelos de lenguaje grandes para escribir o reescribir artículos.
La nueva directriz refleja una creciente preocupación dentro de la comunidad de Wikipedia de que el texto generado por IA pueda entrar en conflicto con los estándares de la plataforma, particularmente en lo que respecta a la verificabilidad y la fiabilidad de las fuentes.
"El texto generado por modelos de lenguaje grandes a menudo viola varias de las políticas de contenido principales de Wikipedia", dice la actualización de la política. "Por esta razón, el uso de LLMs para generar o reescribir contenido de artículos está prohibido, salvo las excepciones que se detallan a continuación".
La política aún permite el uso limitado de herramientas de IA, incluyendo la sugerencia de ediciones básicas de copia para la propia escritura de un editor, siempre que el sistema no introduzca nueva información. Sin embargo, se aconseja a los editores que revisen esas sugerencias cuidadosamente.
Si bien la nueva política no menciona sanciones por usar contenido generado por IA, según las directrices de Wikipedia sobre divulgación, el uso indebido repetido constituye un "patrón de edición disruptiva" y puede llevar a un bloqueo o prohibición. Wikipedia sí ofrece a los editores una vía para restablecer sus cuentas después de un proceso de apelación.
"Los bloqueos pueden revertirse con el acuerdo del administrador que lo impuso, una anulación por parte de otros administradores en caso de que el bloqueo fuera claramente injustificable, o (en casos muy raros) mediante una apelación al Comité de Arbitraje", dijo Wikipedia.
"La Fundación Wikimedia no determina las políticas y directrices editoriales en Wikipedia; lo hacen los editores voluntarios", dijo un portavoz de la Fundación Wikimedia a Decrypt. "La fuerza de Wikipedia ha sido y siempre será su modelo centrado en el ser humano y dirigido por voluntarios".
Según Emily M. Bender, profesora de lingüística en la Universidad de Washington, algunos usos de modelos de lenguaje en herramientas de edición pueden ser razonables, pero establecer un límite claro entre la edición y la generación de texto puede ser difícil.
"Así, una de las cosas que se pueden hacer con un modelo de lenguaje es construir un muy buen corrector ortográfico, por ejemplo", dijo Bender a Decrypt. "Creo que es razonable decir que está bien pasar un corrector ortográfico sobre las ediciones. Y si se está haciendo el siguiente nivel, un corrector gramatical, eso también puede estar bien".
Bender dijo que el desafío surge cuando los sistemas van más allá de corregir la gramática y comienzan a alterar o generar contenido, señalando que los modelos de lenguaje grandes carecen del tipo de responsabilidad que los colaboradores humanos aportan a los proyectos de conocimiento colaborativo.
"Al usar modelos de lenguaje grandes para producir texto sintético, es una propiedad fundamental de estos sistemas que no hay responsabilidad, ninguna conexión con lo que alguien cree o respalda", dijo. "Cuando hablamos, hablamos basándonos en lo que creemos y de lo que somos responsables, no en una noción objetiva de la verdad. Y eso no existe para los modelos de lenguaje grandes".
Bender dijo que el uso generalizado de ediciones generadas por IA también podría afectar la reputación del sitio.
"Si la gente toma atajos y crea algo que parece una edición o un artículo de Wikipedia y lo publica allí, entonces eso degrada el valor y la reputación general del sitio", dijo.
Joseph Reagle, profesor asociado de estudios de comunicación en la Universidad Northeastern, que estudia la cultura y la gobernanza de Wikipedia, dijo que la respuesta de la comunidad refleja preocupaciones de larga data sobre la precisión y las fuentes.
"Wikipedia desconfía de la prosa generada por IA", dijo Reagle a Decrypt. "Toman en serio las caracterizaciones precisas de lo que las fuentes confiables afirman sobre un tema. La IA ha tenido serias limitaciones en ese frente, como afirmaciones 'alucinadas' y fuentes fabricadas".
Reagle dijo que las políticas centrales de Wikipedia también moldean cómo los editores ven las herramientas de IA, señalando que muchos modelos de lenguaje grandes han sido entrenados con contenido de Wikipedia. En octubre, la Fundación Wikimedia dijo que las visitas humanas a Wikipedia cayeron aproximadamente un 8% interanual, ya que los motores de búsqueda y los chatbots ofrecen cada vez más respuestas directamente en sus plataformas, en lugar de enviar a los usuarios al sitio.
En enero, la Fundación Wikimedia anunció acuerdos con empresas de IA, incluyendo Microsoft, Google, Amazon y Meta, permitiéndoles usar material de Wikipedia a través de su producto Enterprise, un servicio comercial diseñado para la reutilización a gran escala de su contenido.
"Si bien el uso del contenido de Wikipedia está permitido por las licencias de Wikipedia, todavía existe cierta antipatía entre los wikipedistas hacia los servicios que se apropian del contenido de las comunidades y luego imponen demandas no deseadas a esas comunidades para lidiar con la consiguiente avalancha de 'basura' generada por IA", dijo Reagle.
A pesar de la prohibición de usar LLMs, Wikipedia sí permite que las herramientas de IA traduzcan artículos de otras ediciones lingüísticas al inglés, siempre que los editores verifiquen el texto original. La política también advierte a los editores que no confíen únicamente en el estilo de escritura para identificar contenido generado por IA y, en su lugar, se centren en si el material cumple con las políticas centrales de Wikipedia y el historial de ediciones del contribuidor.
"Algunos editores pueden tener estilos de escritura similares a los LLMs", dice la actualización. "Se necesita más evidencia que solo signos estilísticos o lingüísticos para justificar sanciones, y es mejor considerar el cumplimiento del texto con las políticas de contenido centrales y las ediciones recientes del editor en cuestión".
Nota del editor: Este artículo fue actualizado después de su publicación para incluir comentarios de la Fundación Wikipedia.