2018 war ein denkwürdiges Jahr für Künstliche Intelligenz. Ich habe drei wichtige Trends herausgegriffen und stelle sie euch vor.

Wohl kaum eine andere Technologie hat die mediale Berichterstattung 2018 so sehr in den Bann gezogen wie Künstliche Intelligenz. Zwischen Heilsversprechungen und Weltuntergangszenarien liegt die Realität: KI-Technologie ist angekommen und schickt sich an, die nächste große transformative Technologie zu werden.

Doch bis zur Super-KI oder gar der flächendeckenden KI-Nutzung ist es noch ein weiter Weg: Fahrerlose Autos sucht man wohl auch 2019 und darüber hinaus vergebens auf den Straßen. Zum Beispiel startete Googles Waymo diesen Monat einen autonomen Taxi-Service, doch hinter dem Steuer muss zur Sicherheit immer noch ein Fahrer sitzen. Wir vertrauen Künstlicher Intelligenz noch nicht.

Wohl zu Recht: Trotz vieler signifikanter Erfolgsmeldungen sind KI-Anwendungen mit unserer komplexen Welt überfordert, das zeigten kürzlich neue Benchmarks von Facebook-Forschern zu bestärkendem Lernen. Die mächtige KI-Trainingsmethode erzielt in einfachen simulierten Umgebungen und Spielen herausragende Ergebnisse – aber eben nicht in Echtwelt-ähnlichen Szenarien.

Die Annäherung an deren Komplexität erfolgt in kleinen Schritten: Die Non-Profit-Organisation OpenAI beispielsweise brachte einer Roboterhand Fingerfertigkeit in einer Computersimulation bei.

Unabhängig von kulturell und durch Science-Fiction geprägten und daher meist überzogenen Erwartungen an das, was Künstliche Intelligenz sein kann und sollte, gab es 2018 große Fortschritte zu verzeichnen – beim maschinellen Sehen, in der Sprachforschung und bei der öffentlichen Auseinandersetzung mit ethischen Fragen.

Die Maschine lernt das Sehen

Computer Vision trumpft groß auf

Maschinensehen wird seit geraumer Zeit in Apps fürs Entertainment oder den Komfort eingesetzt: Snapchats oder Facebooks AR-Gesichtsfilter sind Beispiele sowie Apples Face ID.

Mit Apps wie Google Lookout oder Lens sind dieses Jahr komplexere Maschinensehen-Anwendungen erschienen. Lens kann laut Google über eine Milliarde Objekte identifizieren. Die gleiche Technologie hilft Ärzten bei der Diagnose von KrebsAugenkrankheiten oder Alzheimer und bringt Autos das Sehen bei.

KI in der Unterhaltungsindustrie

Neben der Bildanalyse hat die Bildgenerierung in den vergangenen Monaten einen großen Sprung gemacht. Was sich Ende 2017 mit Deepfakes andeutete, wurde 2018 kontinuierlich weiterentwickelt. Die Ergebnisse zeigen: Künstliche Intelligenz verändert das Spiel mit den Pixeln grundlegend.

Eine Nvidia-KI erzeugt Fotos künstlicher Promis und von Durchschnittstypen. Die täuschend echten Fake-Fotos nie existierender Menschen kommen sogar bei Tinder gut an. Deepminds Bild-KI fälscht Tier- und Naturbilder.

Keine der Personen auf diesem Bild existiert in Wirklichkeit. Sie entspringen einem mit Portraitfotos trainierten neuronalen Netz. Bild: Nvidia

Nvidia zeigte erstmals einen komplett KI-generierten virtuellen Straßenzug in einem interaktiven Videospiel. Die KI erstellte die realistisch anmutende Computerwelt mit Daten aus echten Fahrvideos. Hier deuten sich große Veränderungen an, wie zukünftig digitale Effekte und Welten erstellt werden können.

Apropos Videos: KI kann neben Fotos auch Bewegtbild verändern. Deep Video Portrait beispielsweise lässt die Ende 2017 erstellten Deepfakes-Videos beinahe wie Technik von gestern wirken: Die Mimik einer Person wird – das ist neu – samt Kopfbewegungen auf das Gesicht einer zweiten Person in einem Video projiziert. Sogar der Schattenwurf des Kopfes wird korrekt gefälscht.

Mit Nvidias RTX-Grafikkarten hält erstmals dedizierte KI-Hardware Einzug in Privathaushalte. Die KI-Kantenglättung DLSS ist die erste KI-Anwendung für die Chips und lässt erahnen, wie KI die Zukunft moderner Grafik prägen könnte.

2018 war auch das Jahr, in dem das Auktionshaus Christie’s Geschichte schrieb: Es versteigerte erstmals ein KI-Gemälde – und das für sagenhafte 432.000 US-Dollar. Eigentlich erwartete die Künstlergruppe hinter dem Algorithmus nur einen Erlös in Höhe von circa 10.000 US-Dollar. Dieses Ereignis haben wir ausführlich in unserem Podcast diskutiert.

Eigentlich wollte die Künstlergruppe Obvious mit ihrem ungewöhnlichen KI-Gemälde im Optimalfall 10.000 US-Dollar erlösen. Jetzt ist es etwas mehr geworden. Sehr viel mehr.

Da hängt sie an der Wand und verwirrt die Welt: KI-Kunst im Wert von über 400.000 US-Dollar. Bild: Christie’s

Weitere Highlights der KI-Pixelmanipulation: Eine KI, die virtuelle Welten nahezu im Alleingang erstellt, Modder, die alte Texturen von Spieleklassikern mit Minimalaufwand hochwertig modernisieren und Photogrammetrie-Profis, die Tausende Fotos automatisch von einer KI bereinigen und hochrechnen lassen.

Diese Beispiele zeigen, weshalb Pixelschubser-KI so mächtig ist: Es geht nicht (unbedingt) um das visuell hochwertigere Endprodukt, sondern um eine drastische Reduzierung des Arbeitsaufwands durch eine neue Art, Computer anzuweisen, Aufgaben eigenständiger zu erledigen.

Die KI der 3D-Software “Prometheus” erstellt auf Wunsch im Alleingang ein unaufgeräumtes Kinderzimmer. Der Spieleentwickler oder Designer kann sich anschließend um die Details kümmern. Bild: Prometheus

Im Zentrum dieser KI-gestützten Bild- und Videorevolution stehen fast immer sogenannte neuronale GAN-Netzwerke, bei denen zwei KI-Agenten kooperativ ihre Bild- oder Videodaten optimieren.

Ein Agent erstellt den Inhalt, der andere bewertet ihn – bis das Ergebnis im Kontext der gestellten Aufgabe überzeugt. Die Ausgabe der Inhalte kann im großen Stil nach oben skaliert werden. Der Mensch legt in der Zwischenzeit die Füße hoch.

Der Erfinder des GAN-Verfahrens Ian Goodfellow arbeitet bei Google Brain und sagt: Menschen dürfen Fotos und Videos im Internet zukünftig noch weniger trauen, da Fälschungsmethoden stark vereinfacht und für Laien zugänglich werden.

KI versteht die Menschen

2018 war auch das Jahr der Sprach-KIs: Die maschinelle Verarbeitung menschlicher Sprache (NLP) hat den Siegeszug von Sprachassistenten wie Amazons Alexa oder Googles Assistent vorangetrieben. Die Spracherkennungsquote aller gängigen Assistenten liegt jenseits der 99-Prozent-Marke.

Intelligente Chatbots finden Einsatz im Kunden-Support, der medizinischen Versorgung oder als therapeutische Begleiter.

Highlight bei der Sprachgenerierung ist zweifelsohne Googles Telefon-KI Duplex, die klingt wie ein Mensch. Das hatte eine Ethikdebatte zur Folge: Darf eine KI vortäuschen, ein Mensch zu sein?

Bei der Sprachverarbeitung gab es ebenfalls Fortschritte: Microsoft stellte eine KI-Übersetzerin vor, die Chinesisch so gut wie menschliche Profis ins Englische überträgt – laut Microsoft ein “historischer Durchbruch”.

Ebenfalls bemerkenswert: Eine Alibaba-KI schlug Menschen im “Stanford Reading und Comprehension Test”. In dem etablierten Leseverständnis-Test muss eine KI Texte lesen und anschließend Fragen zum Inhalt beantworten.

Unüberwachtes Lernen und vortrainierte Sprachmodelle

Eine weitere Sprachrevolution wurde 2018 wenigstens angedeutet. Forscher brachten einer KI erstmals das Übersetzen mittels unüberwachtem Lernen bei: Eine Sprache wird ohne menschliche Beispielübersetzungen von Grund auf rekonstruiert.

Die Qualität der Übersetzungen lag bei bekannten Sprachen zwar weit hinter gängigen überwachten Lernmethoden mit menschlichen Beispielen zurück. Jedoch konnte das Verfahren Erfolge in Sprachen erzielen, für die keine großen, aufbereiteten Datenmengen vorliegen. Das könnte in Zukunft Übersetzungen von antiken Dokumenten oder seltenen Sprachen und Dialekten ermöglichen.

Deepl kann zwar kein Vogonisch, aber dafür muss man sich auch nicht ihrer Dichtkunst hingeben. Bild: Screenshot

Eine weitere KI-Innovation: Vortrainierte Sprachmodelle, die Forscher in ihre eigenen Sprach-KI-Projekte integrieren und anpassen können. Diese Modelle können zum Beispiel Artikel zusammenfassen, Emails verlässlicher als Spam oder Betrugsversuch erkennen oder eine Kurzgeschichte zu Ende erzählen.

Die Einführung dieser Modelle – unter anderen ELMo – wurde als großer Moment in der Sprach-KI-Forschung gefeiert. Forscher erwarten nun für sprechende Künstliche Intelligenz einen ähnlich rasanten Fortschritt, wie er 2012 für das Maschinensehen ausgelöst wurde, als Deep Learning den ImageNet-Wettbewerb bezwang.

Verstehen die Menschen KI?

Mit zunehmender Verbreitung von KI-Technologie steigt das Interesse an möglichen und bereits existierenden Auswirkungen: KI ist ein Thema in öffentlichen Debatten. Wie in keinem Jahr zuvor wurden 2018 politische Agenden beschlossen, ethische Prinzipien verkündet und Warnungen ausgesprochen.

Seit 2015 wird in der Politik deutlich mehr über maschinelles Lernen und KI gesprochen. Bild: AI Report 2018

Seit 2015 wird in der US-Politik – und nicht nur da – deutlich mehr über maschinelles Lernen und KI gesprochen. Bild: AI Report 2018

Große Nationen haben die Bedeutung Künstlicher Intelligenz für wirtschaftlichen und gesellschaftlichen Wandel erkannt. KI soll die Weltwirtschaft massiv antreiben – doch zu welchem Preis?

In den USA schießt die Zahl der KI-Startups seit 2015 in die Höhe. Bild: AI Report 2018.

Um Massenarbeitslosigkeit zu verhindern und nicht den Anschluss zu verlieren, werden Milliarden investiert. Deutschland stellte dieses Jahr eine nationale Agenda für KI vor. Aus den Reihen der CDU wurde mit “Milla” ein KI-gestütztes Netflix für die Bildung entworfen, das der drohenden technologischen Arbeitslosigkeit mit Weiterbildung begegnen soll.

Frankreich und Kanada wollen ein internationales Gremium schaffen, das die KI-Zusammenarbeit aller Nationen fördert. China will bis 2030 Weltmarktführer im KI-Markt sein – und hat dabei entscheidende Vorteile.

Killerroboter, Gesichtserkennung und Vorurteile

Die in der UNO geführte Debatte über “Killerroboter” erreichte 2018 die großen Technologiekonzerne: Google zog sich nach heftiger interner Kritik aus dem Militärprojekt “Maven” und ähnlichen Projekten zurück – und verzichtete so auf bis zu zehn Milliarden US-Dollar.

Als Konsequenz stellte Google erstmals KI-Regeln auf, die die Einhaltung ethischer Grundsätze bei der Entwicklung von KI-Systemen sicherstellen sollen. Auch die Schwesterfirma Deepmind und Microsoft traten für ethische Prinzipien ein. Im Unterschied zu Google hat Microsoft allerdings kein Problem damit, dem US-Militär KI-Technologie zur Verfügung zu stellen.

Amazon stand ebenfalls in der Kritik: Der Gesichtsanalyse-Software “Rekognition” wurde von US-Abgeordneten Rassismus vorgeworfen. In einem Test erkannte die Software dunkelhäutige US-Kongressabgeordnete schlechter und verwechselte sie zum Teil sogar mit Straftätern. Eine Amazon-Software für die Bewerberauswahl hatte Vorurteile gegenüber Frauen für technische Berufe. Amazon stellte die Entwicklung ein.

Diese fragwürdigen Ergebnisse und der intensive Einsatz von Gesichtserkennung in China – mit krassen Negativbeispielen – brachten Microsoft und Google dazu, für einen ethischen Umgang mit KI-gestützter Überwachung einzutreten beziehungsweise sich im Falle von Google vorerst ganz aus dem Geschäft rauszuhalten. Das ist einigermaßen bemerkenswert, sofern dieser Weg konsequent beschritten wird.

KI-Revolution: Vorbereitung ist alles – aber ist sie möglich?

2018 zeigte Künstliche Intelligenz, was sie schon jetzt kann und eines Tages können wird. Das Innovationstempo ist enorm.

Rast KI in eine Sackgasse und der Hype verpufft? Niemand weiß das, nicht einmal führende Forscher. Für eine positive Entwicklung müssen Wissenschaft, Unternehmen und Politik fragwürdigen Trends speziell bei der Überwachung und maschinellen Vorurteilen begegnen.

Eines ist klar: Wenn sich KI weiter in einem “Wahnsinnstempo” (OpenAI) entwickelt, steht uns die größte technologische Revolution seit der Erfindung des Internets bevor. Sind wir diesmal besser vorbereitet?

Weitere spannende KI-Themen 2018 im Überblick


MIXED-Podcast #143: Google I/O und High Fidelity VR-Abschied | Alle Folgen


Links auf Online-Shops in Artikeln können sogenannte Affiliate-Links sein. Wenn ihr über diesen Link einkauft, erhält MIXED.de vom Anbieter eine Provision. Für euch verändert sich der Preis nicht.