Eine KI löst einen Wissenstest für Achtklässler und die New York Times spricht von einem Durchbruch für KI-Technologie. Was ist passiert?

Im Oktober 2015 stellte das Allen Institute for Artificial Intelligence (AI2) KI-Forscher vor eine Herausforderung: Welche KI schafft es allein durch antrainiertes Sprachverständnis, einen Wissenstest für Achtklässler zu bestehen? Dem Gewinner-Team winkten 50.000 US-Dollar.

Der Test fragt vor allem Wissen der Naturwissenschaften ab. In machen Fragen muss die KI jedoch auch logische Schlüsse ziehen. Bild: AI2

Der Test fragt vor allem Wissen aus den Naturwissenschaften ab. Bei machen Fragen muss die KI jedoch auch logische Schlüsse ziehen. Bild: AI2

Doch keine der 170 teilnehmenden KIs konnte den Multiple-Choice-Test bewältigen. Denn er stellt neben einfachen Wissensfragen auch solche, die logische Schlüsse erfordern. Weshalb genau die KIs scheiterten, lässt sich allerdings nicht genau sagen – es existiert kein einzelner Faktor.

Fortschrittliche Sprach-KIs können mehr als Fake-News

Jetzt ist es KI-Forschern gelungen, einen Algorithmus zu entwickeln, der den Test mit einer Wertung über 90 Prozent besteht: Die KI “Aristo” stammt vom Allen Institut selbst.

Möglich wurde dieser Erfolg durch die Fortschritte bei der Entwicklung von Sprach-KIs, die in den letzten zwei Jahren unter anderem das intern entwickelte ELMO, Googles BERT oder OpenAIs GPT-2 hervorbrachten.

Aristo setzt auf zwei Varianten der Sprach-KI BERT: AristoBERT und AristoRoBERTa – einer Weiterentwicklung von Facebook. Darauf aufbauend nutzt Aristo weitere Problemlösungssysteme. Einige suchen Antworten in Datenbanken, andere versuchen sich an logischen Schlüssen.

Trainiert wurde Aristo mit Frage-und-Antwort-Paaren ähnlicher Tests. Über den genauen Trainingsablauf ist noch nicht viel bekannt, eine wissenschaftliche Veröffentlichung steht aus.

Ist das ein KI-Durchbruch?

Die New York Times schreibt aufgrund des bestandenen Tests von einem Durchbruch für KI-Technologie – aber ist es tatsächlich einer? Das kommt auf die Perspektive an: Immerhin hat es vier Jahre gedauert, bis eine KI den Test bestand. Dass dies nun gelang, ist ein deutliches Zeichen, dass es in den letzten Jahren gerade bei der Entwicklung von Sprach-KIs große Fortschritte gab.

Wer jedoch menschenähnliches Denken und Logik-Fähigkeiten von Aristo erwartet, wird enttäuscht: Auch diese KI beherrscht am Ende “nur” Statistik. Ein wirkliches Verständnis für den Inhalt der korrekt beantworteten Fragen hat sie nicht.

Auf die KI-Praxis dürfte sich Aristo dennoch positiv auswirken: Zum Beispiel könnten digitale Assistenten wie Siri, Alexa oder Google Assistant zukünftig auf nie gehörte Fragen besser antworten.

Titelbild: AI2, Quellen: NYT, GeekWire

Weiterlesen über Künstliche Intelligenz:


MIXEDCAST #160: Ubsioft-VR, Kuro AR-Brille und Deepfake-App Zao | Alle Folgen


Links auf Online-Shops in Artikeln können sogenannte Affiliate-Links sein. Wenn ihr über diesen Link einkauft, erhält MIXED.de vom Anbieter eine Provision. Für euch verändert sich der Preis nicht.