OpenAI stellt eine Künstliche Intelligenz vor, die Texte versteht, übersetzt und schreibt. Die Forscher halten eine Veröffentlichung für zu gefährlich: Das Internet könnte mit automatisch geschriebenen, glaubhaften Fake-Texten überschwemmt werden.

Ursprünglich sollte GPT-2, so der Name der KI, nur das nächste Wort in einem Satz vorhersagen lernen. Als Datenmaterial nutzten die Forscher 40 Gigabyte Internet-Text, der im Metaforum Reddit gepostet wurde. Verwendet wurden nur Texte, die von der Reddit-Gemeinschaft wenigstens drei positive Bewertungen erhielten.

So sollte die Vielfältigkeit des Trainingsdatensatzes gesichert werden, der 15 Mal umfangreicher war als vergleichbare Datensätze. Die Größe ähnlicher Sprachmodelle übertrumpfte GPT-2 um den Faktor zwölf.

Die nächste Generation Sprach-KI

GPT-2 ist Teil einer neuen Generation Sprach-KIs, die im Sommer 2018 vorgestellt wurde: Sie nutzt sogenanntes unüberwachtes Lernen, um aus einer großen undefinierten Textmenge ein Sprachmodell zu erstellen. Anhand dieses Sprachmodells versteht die KI Texte, schreibt sie, stellt Informationen neu zusammen oder spricht.

Diese neue Generation Sprach-KIs gilt als Durchbruch, wie er einige Jahre zuvor bei Künstlicher Intelligenz für die Bildverarbeitung erzielt wurde.

GPT-2 bestätigt die Durchbruch-These: Obwohl die KI nicht explizit für alle Sprac…

MIXED.de Podcast: VR, AR und KI - jede Woche neu

Jetzt reinhören: Alle Folgen


Hinweis: Links auf Online-Shops in Artikeln können sogenannte Affiliate-Links sein. Wenn ihr über diesen Link einkauft, erhält MIXED.de vom Anbieter eine Provision. Für euch verändert sich der Preis nicht.