
Wikipedia-Editoren haben in einem kürzlich erfolgten Richtlinien-Update beschlossen, die Verwendung künstlicher Intelligenz auf der Plattform einzuschränken, indem sie den Einsatz großer Sprachmodelle zum Schreiben oder Umschreiben von Artikeln verbieten.
Die neue Richtlinie spiegelt die wachsende Besorgnis innerhalb der Wikipedia-Community wider, dass KI-generierte Texte mit den Standards der Plattform kollidieren könnten, insbesondere in Bezug auf Überprüfbarkeit und zuverlässige Quellenangaben.
„Von großen Sprachmodellen generierte Texte verstoßen oft gegen mehrere der Kerninhaltsrichtlinien von Wikipedia“, heißt es in der Richtlinienaktualisierung. „Aus diesem Grund ist die Verwendung von LLMs zur Generierung oder Umschreibung von Artikelinhalten verboten, mit Ausnahme der unten genannten Ausnahmen.“
Die Richtlinie erlaubt weiterhin eine begrenzte Nutzung von KI-Tools, einschließlich des Vorschlags grundlegender Korrekturen an den eigenen Texten eines Editors, vorausgesetzt, das System führt keine neuen Informationen ein. Editoren wird jedoch geraten, diese Vorschläge sorgfältig zu prüfen.
Obwohl die neue Richtlinie keine Strafen für die Verwendung von KI-generierten Inhalten erwähnt, stellt wiederholter Missbrauch gemäß den Wikipedia-Richtlinien zur Offenlegung ein „Muster störender Bearbeitung“ dar und kann zu einer Sperrung oder einem Bann führen. Wikipedia bietet Editoren jedoch einen Weg zur Wiederherstellung ihrer Konten nach einem Einspruchsverfahren.
„Sperrungen können mit Zustimmung des sperrenden Administrators, einer Aufhebung durch andere Administratoren im Falle einer eindeutig ungerechtfertigten Sperrung oder (in sehr seltenen Fällen) auf Antrag an das Schiedsgericht rückgängig gemacht werden“, so Wikipedia.
„Die Wikimedia Foundation legt keine redaktionellen Richtlinien und Leitfäden auf Wikipedia fest; das tun ehrenamtliche Editoren“, sagte ein Sprecher der Wikimedia Foundation gegenüber Decrypt. „Die Stärke von Wikipedia war und wird immer ihr menschenzentriertes, ehrenamtlich getragenes Modell sein.“
Laut Emily M. Bender, Professorin für Linguistik an der University of Washington, mögen einige Verwendungen von Sprachmodellen in Bearbeitungstools vernünftig sein, aber eine klare Grenze zwischen Bearbeiten und Textgenerierung zu ziehen, kann schwierig sein.
„Eine der Dinge, die man mit einem Sprachmodell tun kann, ist zum Beispiel eine sehr gute Rechtschreibprüfung zu erstellen“, sagte Bender gegenüber Decrypt. „Ich denke, es ist vernünftig zu sagen, dass es in Ordnung ist, eine Rechtschreibprüfung über Bearbeitungen laufen zu lassen. Und wenn man die nächste Stufe erreicht, eine Grammatikprüfung, kann das auch in Ordnung sein.“
Bender sagte, die Herausforderung entstehe, wenn Systeme über die Korrektur der Grammatik hinausgehen und Inhalte ändern oder generieren, und merkte an, dass großen Sprachmodellen die Art von Rechenschaftspflicht fehle, die menschliche Mitwirkende zu kollaborativen Wissensprojekten beisteuern.
„Die Verwendung großer Sprachmodelle zur Erstellung synthetischer Texte ist eine grundlegende Eigenschaft dieser Systeme, dass es keine Rechenschaftspflicht gibt, keine Verbindung zu dem, was jemand glaubt oder wofür er einsteht“, sagte sie. „Wenn wir sprechen, sprechen wir auf der Grundlage dessen, was wir glauben und wofür wir verantwortlich sind, nicht auf der Grundlage einer objektiven Vorstellung von Wahrheit. Und das gibt es bei großen Sprachmodellen nicht.“
Bender sagte, eine weit verbreitete Nutzung von KI-generierten Bearbeitungen könnte auch den Ruf der Website beeinträchtigen.
„Wenn Leute stattdessen Abkürzungen nehmen und etwas erstellen, das wie eine Wikipedia-Bearbeitung oder ein Artikel aussieht und es dort platzieren, dann mindert das den Gesamtwert und den Ruf der Website“, sagte sie.
Joseph Reagle, außerordentlicher Professor für Kommunikationswissenschaften an der Northeastern University, der die Kultur und Governance von Wikipedia untersucht, sagte, die Reaktion der Gemeinschaft spiegele langjährige Bedenken hinsichtlich Genauigkeit und Quellenangaben wider.
„Wikipedia ist misstrauisch gegenüber KI-generierter Prosa“, sagte Reagle gegenüber Decrypt. „Sie nehmen die genauen Darstellungen dessen, was zuverlässige Quellen über ein Thema aussagen, ernst. KI hatte diesbezüglich ernsthafte Einschränkungen, wie ‚halluzinierte‘ Behauptungen und erfundene Quellen.“
Reagle sagte, die Kernrichtlinien von Wikipedia prägten auch, wie Editoren KI-Tools sehen, und merkte an, dass viele große Sprachmodelle mit Wikipedia-Inhalten trainiert wurden. Im Oktober erklärte die Wikimedia Foundation, dass die menschlichen Besuche auf Wikipedia im Jahresvergleich um etwa 8 % zurückgegangen seien, da Suchmaschinen und Chatbots zunehmend Antworten direkt auf ihren Plattformen bereitstellen, anstatt Benutzer auf die Website zu verweisen.
Im Januar kündigte die Wikimedia Foundation Vereinbarungen mit KI-Unternehmen, darunter Microsoft, Google, Amazon und Meta, an, die es ihnen ermöglichen, Wikipedia-Material über ihr Enterprise-Produkt zu nutzen, einen kommerziellen Dienst, der für die groß angelegte Wiederverwendung ihrer Inhalte konzipiert ist.
„Während die Nutzung von Wikipedia-Inhalten durch die Lizenzen von Wikipedia erlaubt ist, gibt es unter Wikipedianern immer noch eine gewisse Abneigung gegen Dienste, die die Inhalte von Gemeinschaften für sich beanspruchen und dann unerwünschte Forderungen an diese Gemeinschaften stellen, um mit dem daraus resultierenden Überfluss an KI-Müll umzugehen“, sagte Reagle.
Trotz des Verbots der Verwendung von LLMs erlaubt Wikipedia KI-Tools zur Übersetzung von Artikeln aus anderen Sprachausgaben ins Englische, vorausgesetzt, die Editoren überprüfen den Originaltext. Die Richtlinie warnt Editoren auch davor, sich ausschließlich auf den Schreibstil zu verlassen, um KI-generierte Inhalte zu identifizieren, und stattdessen darauf zu achten, ob das Material den Kernrichtlinien von Wikipedia und der Bearbeitungshistorie des Beitragsautors entspricht.
„Einige Editoren könnten ähnliche Schreibstile wie LLMs haben“, heißt es in dem Update. „Mehr Beweise als nur stilistische oder sprachliche Anzeichen sind erforderlich, um Sanktionen zu rechtfertigen, und es ist am besten, die Übereinstimmung des Textes mit den Kerninhaltsrichtlinien und den jüngsten Bearbeitungen des betreffenden Editors zu berücksichtigen.“
Anmerkung des Editors: Dieser Artikel wurde nach Veröffentlichung aktualisiert, um einen Kommentar der Wikipedia Foundation aufzunehmen.