OpenAI: Neue KI fasst Bücher zusammen – mit einem größeren Ziel

OpenAI: Neue KI fasst Bücher zusammen – mit einem größeren Ziel

OpenAIs neue Künstliche Intelligenz fasst komplette Bücher zusammen. Das ist eine nützliche Funktion, doch OpenAIs Forschungsinteresse ist übergeordneter Natur: Es geht darum, die Handlungen einer KI mit den Interessen der Menschheit auf Linie zu bringen.

Eine KI, die Dokumente mit hunderten oder tausenden Seiten sinnvoll zusammenfassen kann, gibt es bisher nicht. Die automatisierte Erstellung von Abstracts, Executive Summarys oder simplen Klappentexten könnte jedoch ein profitabler KI-Markt werden.

OpenAI stellt nun ein neues KI-Modell vor, das komplette Bücher zusammenfassen kann und damit einen Schritt in Richtung dieses Marktes ist – allerdings geht es OpenAI im Kern um ein anderes Thema.

OpenAI: Buch-KI geht iterativ vor – Schritt für Schritt zum gemeinsamen Verständnis

Das neue KI-Modell nutzt eine spezialisierte Variante der Text-KI GPT-3, die bereits rudimentäre Zusammenfassungen erstellen kann. Für die neue Buch-KI setzt OpenAI auf eine erweiterte Trainingsmethode und einen iterativen Textverarbeitungsprozess.

Bereits nach der Vorstellung von GPT-2 begann OpenAI mit Experimenten zu Buchzusammenfassungen. Im Oktober 2019 zeigte Open AI eine GPT-2-Version, die mit menschlichem Feedback trainiert wurde. Bei dieser Variante des bestärkenden Lernens dienten knapp 60.000 menschliche Rückmeldungen zu generierten Zusammenfassungen als Trainingssignal.

Knapp ein Jahr später gab es eine weitere Version, bei der ein zweites KI-Modell von menschlichem Feedback lernte und anschließend als Trainingssignal für GPT-2 diente.

OpenAIs neue Künstliche Intelligenz fasst automatisch Bücher zusammen und erzielt dabei neue Bestwerte. Menschliche Zusammenfassungen sind dennoch meistens besser. Ohnehin forscht OpenAI eigentlich an einem anderen Thema, nämlich dem sicheren Zusammenspiel zwischen Mensch und Maschine. | Bild: OpenAI

Für das KI-Training des neuen Modells setzt OpenAI erneut auf bestärkendes Lernen mit menschlichem Feedback. Die Bewertung der Qualität einer Buchzusammenfassung ist jedoch deutlich anspruchsvoller als von einzelnen Texten, da Menschen das Buch vollständig gelesen haben sollten.

OpenAI nutzt daher einen iterativen Prozess, bei dem das KI-Modell das Buch zunächst in Abschnitte aufteilt und diese einzeln zusammenfasst. Aus diesen Abschnitten entsteht anschließend die Buchzusammenfassung. Damit umgeht OpenAI auch die Kontext-Begrenzung aktueller Transformer-Modelle wie GPT-3.

KI-Zusammenfassung in manchen Fällen auf menschlichem Niveau

Für das KI-Training und die anschließenden Tests nutzt OpenAI ausschließlich narrative Werke wie Alice im Wunderland oder Romeo und Julia. Die einzelnen Zusammenfassungen der Abschnitte und das Endergebnis werden von Menschen bewertet und als Trainingssignal eingesetzt.

OpenAI testete neben dem bestärkenden Lernen noch andere Lernmethoden, die jedoch deutlich schlechter abschnitten, und trainierte zwei Varianten mit 175 Milliarden respektive 6 Milliarden Parametern.

Das große KI-Modell schneidet nach dem Training am besten ab und erreicht in fünf Prozent der Fälle einen Qualitätswert von 6 von 7 Punkten auf einer Likert-Skala. Bei 15 Prozent der Zusammenfassungen erzielte das System einen Wert von 5 von 7 Punkten.

Diese Werte erreichen laut OpenAI auch von Menschen zusammengefasste Texte. In den meisten Fällen schneide die KI jedoch noch immer deutlich schlechter ab als menschliche Zusammenfassungen.

Im KI-Bereich ist das Modell dennoch ein Fortschritt: Es erzielt im BookSum-Datensatz für Zusammenfassungen in Buchlänge die besten Ergebnisse. Ein Zero-Shot-Modell zur Beantwortung von Fragen kann die Zusammenfassungen des KI-Modells außerdem für Antworten auf Fragen im NarrativeQA-Datensatz verwenden.

Eine Veröffentlichung der Buch-KI ist seitens OpenAI vorerst nicht geplant.

OpenAI forscht an Ausrichtung von KI-Systemen

Für OpenAI ist die Buch-KI in erster Linie ein Test für ein größeres Thema: Es gehe um die Ausrichtung fortschrittlicher KI-Systeme entlang menschlicher Ziele, schreibt OpenAI.

Der grundlegende Gedanke: Wenn die Buch-KI ein Buch anhand einzelner Abschnitte zusammenfasst, also mit Zwischenresultaten, sind diese einzelnen Ergebnisse für Menschen leichter bewert- und nachvollziehbar als die komplette Zusammenfassung des Buches.

Dieses iterative Vorgehen, sofern es auf andere Bereiche übertragbar ist, könnte ein Baustein für die Lösung des sogenannten Alignment Problems sein. Das befasst sich mit der Frage, wie wir dafür sorgen können, dass eine Künstliche Intelligenz stets im Einklang mit menschlichen Bedürfnissen, Werten und Zielen handelt. Transparenz und Nachvollziehbarkeit der KI-Modelle könnten hierfür grundlegend sein.

„Da wir unsere Modelle für immer komplexere Aufgaben trainieren, wird es für den Menschen zunehmend herausfordernder, die Ergebnisse der Modelle fundiert zu bewerten. Dadurch wird es schwieriger, subtile Probleme in den Modellergebnissen zu erkennen, die beim Einsatz dieser Modelle zu negativen Folgen führen könnten“, schreiben OpenAIs Forscher.

Weiterlesen über Künstliche Intelligenz:

Quelle: OpenAI, Arxiv