Deepmind: Neue Alleskönner-KI kann viele Spiele spielen

Deepmind: Neue Alleskönner-KI kann viele Spiele spielen

Deepminds neues KI-System spielt Brettspiele wie Schach oder Go, räumt aber auch am Pokertisch auf. Warum das eine echte Herausforderung ist.

Mit Werbeeinnahmen bezahlen wir unsere Redakteur:innen.
Mit einem MIXED-Abo kannst Du unsere Seite werbefrei lesen.

Das Londoner KI-Unternehmen Deepmind hat eine lange Geschichte in der Entwicklung von KI-Systemen für Brett- und Videospiele. Schon früh erregte Deepmind Aufmerksamkeit mit Künstlicher Intelligenz, die eine ganze Reihe von Atari-Spielen meisterte.

Seitdem hat Alphabets KI-Unternehmen mit AlphaGo einen Go-Weltmeister besiegt, mit AlphaGo Zero und AlphaZero die eigenen Vorgänger geschlagen, mit AlphaStar Gaming-Profis in die Schranken gewiesen und mit MuZero ein KI-Modell eingeführt, das Spielregeln eigenständig lernt.

Die Entwicklung dieser Spiele-KIs stellt die Forschenden immer wieder vor neue Herausforderungen, da Spiele kognitive Fähigkeiten und Problemlösefähigkeit erfordern. Deepminds KI-Entwicklung für Brett- und Videospiele ist daher Grundlagenforschung, die sich womöglich auf andere, wirtschaftlich attraktive KI-Anwendungen wie das autonome Fahren übertragen lässt.

Player of Games: Vom Spezialisten zum Multitalent

Spiele lassen sich grob in zwei Kategorien trennen: Solche, die alle Informationen, wie die Position von Spielfiguren, aufzeigen und solche, in denen Informationen, wie etwa die Karten von Mitspieler:innen, verdeckt sind.

Spiele mit vollständigen Informationen sind etwa die Spezialität von AlphaZero. Das System kann allerlei Brettspiele wie Schach oder Go auf übermenschlichem Niveau spielen. KI-Systeme für Spiele mit unvollständigen Informationen wie Poker agieren mittlerweile ebenfalls auf hohem Niveau: 2016 schlug die Poker-KI DeepStack menschliche Profis. Mitte 2019 zeigte Facebook eine Poker-KI, die gleich fünf Spieler gleichzeitig in einem Turnier besiegen konnte.

Aber: AlphaZero spielt kein Poker, DeepStack kein Schach – die Systeme sind also Spezialisten.

logo
  • checkMIXED.de ohne Werbebanner
  • checkZugriff auf mehr als 9.000 Artikel
  • checkKündigung jederzeit online möglich
ab 2,80 € / Monat
logo

Empfohlener Beitrag

Schachfiguren
Deepmind MuZero: Auf dem Weg zum Universalalgorithmus
Mit Werbeeinnahmen bezahlen wir unsere Redakteur:innen.
Mit einem MIXED-Abo kannst Du unsere Seite werbefrei lesen.

Deepminds neuste Spiele-KI „Player of Games“ (PoG) ändert das. Laut des Unternehmens ist PoG der erste generelle und funktionierende Suchalgorithmus, der eine starke Leistung in Spielen mit vollständigen und unvollständigen Informationen zeigt.

Player of Games erweitert AlphaZeros Erfolgsrezept

AlphaZeros Erfolgsrezept lautete, die Spielregeln zu kennen, um dann mit einem Suchalgorithmus unzählige Partien gegen sich selbst zu trainieren. Das KI-System setzt für den Suchalgorithmus auf die Tiefensuche von Entscheidungsbäumen, genauer auf MCTS (Monte Carlos tree search). Diese Methode eignet sich jedoch nicht für Spiele mit unvollständigen Informationen, bei denen spieltheoretische Überlegungen, wie das Verschleiern der eigenen Intentionen, zwingend notwendig sind.

Für PoG ändert Deepmind daher den Suchalgorithmus: PoG startet mit einem simplen Entscheidungsbaum möglicher Strategien und spielt gegen sich selbst. Nach jedem Spiel analysiert das System, wie in einzelnen Situationen eine andere Entscheidung den Ausgang des Spiels verändert hätte. Mit dieser kontrafaktischen Lernmethode wächst der Entscheidungsbaum im Laufe des Trainings.

Durch das Training kann PoG Schach, Go, Poker und Scotland Yard spielen. Deepmind testete das KI-System gegen verschiedene Bots, darunter AlphaZero, GnuGo, Stockfish und Slumbot. In Poker und Scotland Yard gewann PoG die meisten Spiele. In Schach und Go verlor PoG 99,5 Prozent aller Spiele gegen AlphaZero. Das System spiele dennoch zumindest auf sehr hohem Amateurniveau, sagt Deepmind.

Für die Forschenden ist PoG ein großer Schritt auf dem Weg zu einer echten generellen Spiele-KI. Mehr Training könnte das System laut Deepmind weiter verbessern. Ebenso sei es eine interessante Frage, ob ein ähnliches Niveau mit deutlich weniger Rechenressourcen möglich sei, schließen die Autoren ab.

Weiterlesen über Künstliche Intelligenz:

Quellen: Arxiv