Der Fortschritt bei der Textgenerierung durch Künstliche Intelligenz erfordert neue Werkzeuge, um Fake-Texte zu entdecken. Ein neues Tool funktioniert direkt im Browser.

Der Fortschritt KI-gestützter Textgeneratoren lässt sich gut an OpenAIs Veröffentlichungspolitik zu GPT-2 ablesen, einem der mächtigsten derzeit verfügbaren Generatoren: Im Februar hieß es, die Software sei zu gefährlich, um sie zu veröffentlichen. Die Forscher von OpenAI befürchteten eine Fake-Text-Schwemme.

Stattdessen sollten die mächtigeren Modelle nach und nach und die Vollversion womöglich gar nicht veröffentlicht werden. Dann passierte das Internet und freie Forschung: Auf Basis von GPT-2 entwickelten Nvidia, Studierende und Forscher noch mächtigere KI-Textgeneratoren und veröffentlichten sie frei verfügbar im Netz.

OpenAI zog die aus dieser Entwicklung einzig richtige Konsequenz und veröffentlichte Anfang November die Vollversion von GPT-2, die man hier im Browser testen kann.

GPT-2 Fake-Text entlarven

Dass man auf von GPT-2 generierte Überschriften leicht hereinfallen kann, zeigt ein aktuelles Online-Quiz (englisch), bei dem man aus drei Überschriften die von einer KI geschriebene herausfiltern muss. Ich lag bei meinem Durchlauf mit rund der Hälfte meiner Tipps falsch. Die Glaubwürdigkeit von GPT-2-Texten wurde bei Untersuchungen einer Universität mit 6,92 von zehn Punkten beziffert.

Ein von mir generierter GPT-2 Fake-Text wird mit hoher Wahrscheinlichkeit erkannt. Bild: Screenshot

Ein von mir generierter GPT-2 Fake-Text wird mit hoher Wahrscheinlichkeit erkannt. Bild: Screenshot

Parallel zur Vollversion von GPT-2 entwickelte OpenAI daher ein Werkzeug, um die generierten Texte als solche zu erkennen. Das klappte in Tests mit einer Zuverlässigkeit von bis zu 95 Prozent.

Eben dieses Tool hat nun ein Entwickler als Demoversion ins Netz gestellt: Ihr fügt in die Box euren Text ein, anschließend wird dieser auf typische GPT-2-Muster geprüft. Eine Prozentangabe unter der Box zeigt an, mit welcher Wahrscheinlichkeit der Text von GPT-2 generiert wurde. Ab circa 50 Zeichen arbeitet der Detektor verlässlich.

Weiterlesen über Künstliche Intelligenz:

steady2

MIXEDCAST #171: Das Carmack-Drama, Stormland und Magic Leak | Alle Folgen


Links auf Online-Shops in Artikeln können sogenannte Affiliate-Links sein. Wenn ihr über diesen Link einkauft, erhält MIXED.de vom Anbieter eine Provision. Für euch verändert sich der Preis nicht.