Inhalt
newsletter Newsletter

TV-Schnee ist für eine neugierige Künstliche Intelligenz einfach unwiderstehlich.

Einige der mächtigsten KI-Systeme unserer Zeit lernen, weil sie dafür von außen belohnt werden. Was dem Hund sein Leckerli oder dem strebsamen Schüler seine Note, ist für eine KI eine höhere Punktzahl oder ein gewonnenes Spiel.

OpenAIs Team-KI "Five" oder Googles Super-KI "Alpha Zero" wurden mit diesem Verfahren ausgebildet. In der Fachsprache heißt es bestärkendes Lernen.

Vom Menschen wissen wir jedoch, dass die intrinsische die extrinsische Motivation deutlich übertreffen und zu besseren Ergebnissen führen kann. Außerdem sinkt der Betreuungsaufwand für den Lernenden, da er sich Inhalte und Zusammenhänge eigenständig erschließt.

Anzeige
Anzeige

Wie verhält sich eine neugierige KI in Videospielen?

KI-Forscher von OpenAI und den Universitäten Berkeley und Edinburgh versuchten daher in einem Experiment, eine intrinsisch motivierte Künstliche Intelligenz zu entwickeln. Sie sollte Videospiele aus Neugierde erforschen.

Technisch übersetzten die Forscher Neugierde, indem sie die KI dafür belohnten, neuen Inhalt zu entdecken. Sie sagte den nächsten Bildausschnitt vorher und überprüfte dann ihre Vorhersage. Bei einer falschen Vorhersage galt der Inhalt als neu - Mission erfüllt.

Das Ergebnis: Die neugierige KI entwickelte Fähigkeiten in klassischen Spielen wie Super Mario Bros. und Pong. Insgesamt erforschte sie mehr als 50 Spiele. Einige davon konnte sie sogar erfolgreich beenden. Bei Super Mario passierte sie elf Level.

Eine Auswahl der Spiele, die die neugierige KI eigenständig erforschen durfte. Bild: Burda / OpenAI
Eine Auswahl der Spiele, die die neugierige KI eigenständig erforschen durfte. Bild: Burda / OpenAI

Faszination Fernsehen

Es entstanden allerdings auch ungewöhnliche Resultate: Zwei neugierige KIs spielten sich beim Pong-Duell den Ball lieber permanent volley zu, anstatt den Spielregeln zu folgen. Das eigentliche Ziel bei Pong ist es, den Ball am Gegner vorbeizuschießen.

Manchmal starb die KI absichtlich, um den Game-Over-Screen zu entdecken - auch das war für sie neuer Inhalt.

Empfehlung

Und: Die KI-Neugierde lässt sich wie ihr menschliches Gegenstück sehr einfach mit einem TV-Gerät befriedigen.

In einem digitalen Labyrinth versteckten die Forscher einen Fernseher samt Fernbedienung. Sobald die KI den TV fand, blieb sie davor hängen und zappte auf der Suche nach neuen Inhalten durch die Kanäle.

Die Forscher zeigten zwar nur Schneegestöber. Doch für eine pixelanalysierende KI ohne grundlegendes Verständnis für Inhalt ist das offenbar ausreichend abwechslungsreich. Nur in Ausnahmefällen konnte sie sich wieder vom TV-Gerät lösen.

Die Neugierde der KI-Forscher, ob eine neugierige KI möglich ist, hat einen pragmatischen Hintergrund: Eine aus Neugierde effizient lernende KI bräuchte - wie Menschen - weniger Betreuung. Das wiederum würde den Aufwand für die Einrichtung des KI-Systems reduzieren.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Größere Lernprojekte wären möglich: Beispielsweise könnte die neugierige KI eigenständig Fehler in Videospielen oder in Programmiercode finden.

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!