Zehn nützliche Fähigkeiten, die Künstliche Intelligenz jetzt schon hat

Zehn nützliche Fähigkeiten, die Künstliche Intelligenz jetzt schon hat

Bis zur Super-KI dauert es zwar noch eine Weile, aber das schmälert die Leistung aktueller KI-Technologie nicht. Hier sind zehn Fähigkeiten, die Künstliche Intelligenz heute schon auf dem Kasten hat.

Wenn ihr mehr lernen wollt über KI, empfehle ich euch meine Artikel mit einfachen Erklärungen zu häufig genutzten KI-Fachbegriffen und über die Frage, ob Künstliche Intelligenz wirklich intelligent ist.

Sehen

Mit maschinellem Sehen (Computer Vision) wirft Künstliche Intelligenz einen Blick auf die Welt. Sie analysiert visuelle Daten und identifiziert so Gegenstände, Tiere oder Personen. Der Durchbruch für maschinelles Sehen kam 2012 mit einer Bildanalyse-KI, die den ImageNet-Wettbewerb haushoch gewann.

Seitdem ist die Technologie auf dem Vormarsch: Fast 170.000 Patente für maschinelles Sehen wurden bis Anfang 2019 registriert – fast die Hälfte aller KI-Patente. Immer weiter verbreitet: Staubsaugerroboter, die selbstständig Wohnungen kartografieren und reinigen. Auch das ist Computer-Vision-Technologie.

Bilderkennungs-KIs identifizieren Personen - oder auch mal eine Switch.

Bilderkennungs-KIs identifizieren Objekte in Bildern. Bild: Eigener Screnshot / Google

Sehende KI wird in selbstfahrenden Autos eingesetzt, erkennt Krebserkrankungen, beschleunigt MRT-Scans um das vierfache, sie entsperrt Smartphones, überwacht Baustellen, schaut durch Wände, beschreibt Bilder, findet Gemeinsamkeiten in Kunstwerken verschiedener Epochen und hilft alte Fotos zu restaurieren.

Die gleiche Technologie ist jedoch auch wichtiger Antrieb der KI-gestützten Kriegsführung, Pseudowissenschaft wie der Verbrechererkennung und erkennt Gesichter auf Überwachungskameras. Die KI-gestützte Überwachung ist weltweit auf dem Vormarsch – auch in Europa. So testete die Bundespolizei am Berliner Südkreuz ein Jahr lang Gesichtserkennung und die EU-Kommission will mit Roxanne eine KI-Überwachungsplattform für Strafverfolgungsbehörden aufbauen.

Einige Städte, darunter die Technologiehochburg San Francisco, haben Gesichtserkennung mittlerweile verboten – aus Angst vor einem übermächtigen Überwachungswerkzeug, das sich verselbstständigt. Die Anti-Rassismus-Proteste in den USA haben Amazon und Microsoft dazu veranlasst, vorerst keine Gesichtserkennungssoftware mehr an die US-Polizei zu verkaufen. Unternehmen können die Software jedoch weiter einsetzen – außer in Portland, wo das bisher härteste Verbot der Technologie beschlossen wurde.

Hören

An digitale Assistenten haben wir uns längst gewöhnt: Amazons Alexa (Amazon-Link), Googles Assistant oder Apples Siri, sie alle lauschen unseren Anfragen am Smartphone und an intelligenten Lautsprechern. Spezialisierte KI-getriebene Apps wie Google Transcribe oder Ciscos Voicea transkribieren Gespräche automatisch auf hohem Niveau.

Die KI-Analyse von Audiodaten kann noch mehr: Shotspotter erkennt Schussgeräusche, lokalisiert sie und alarmiert die Polizei. Google lässt Wale mit KI belauschen und erfährt so mehr über ihre Routen und Bestände. Und NL Acoustics KI erkennt an für Menschen lautlosen Geräuschveränderungen, ob eine Maschine kaputt geht.

Hinter den stetigen Verbesserungen der digitalen Lauscher stehen oft Menschen: Google Assistant, Amazons Alexa und Siri – überall hören und bewerten Lohnarbeiter Gespräche, um die Funktion zu verbessern. Wer das nicht will, kann etwa beim Google Assistant die Audio-Analyse deaktivieren lassen.

Sprechen

Digitale Assistenten lauschen glücklicherweise nicht nur – sie antworten auch. Alexa klärt uns über das Wetter auf, Google Maps navigiert uns zu unserem Ziel und Duplex übernimmt seit 2018 Anrufe beim Restaurant und seit kurzem beim Friseur – zumindest in englischer Sprache. Seit Beginn der Corona-Pandemie hat Duplex außerdem mehr als drei Millionen Updates an den Google-Maps-Geschäftseinträgen von Unternehmen wie Apotheken, Restaurants und Supermärkten vorgenommen. Dafür ruft die Telefon-KI automatisch vor Ort an und interviewt die Person am anderen Ende.

KI-generierte Sprache wird glaubwürdiger und die Gesprächsführung eleganter. Googles Telefon-KI Duplex wurde stark kritisiert, da die Computerstimme klang wie ein Mensch. Das resultierte in einer Grundsatzdiskussion: Darf eine Maschine einen Menschen täuschen? Erst nach einigem Hin und Her versicherte Google, dass sich die KI in Gesprächen immer als Maschine zu erkennen geben wird – und das muss sie auch.

Wer lieber mit den Stimmen anderer Personen spricht, kann mit KI jeden alles sagen lassen. KI fälschte nach einem umfassenden Training die Stimme des bekannten Podcasters Joe Rogan, ermöglichte Tech-YouTuber Linus einen freien Tag oder hilft Betrügern, einen Wirtschaftsboss zu imitieren. Unternehmen wie Resemble AI bieten mittlerweile KI-generierte Stimmen an – schon ab fünf Minuten Trainingsdaten.

Lesen

Ein großer Teil des menschlichen Wissens ist in Schriftform festgehalten. Wer an diese Daten will, sollte lesen können. Noch ist das Textverständnis von KIs eingeschränkt, aber erste Anwendungen zeigen, was möglich sein könnte.

Der KI-getriebene SummarizeBot fasst Texte wie Artikel, E-Mails oder Buchpassagen zusammen. Eine andere KI durchforstet wissenschaftliche Veröffentlichungen nach neuen Materialien für die Elektrotechnik. Deepminds Pythia stellt antike Texte wieder her, DeepL übersetzt moderne Sprachen fast wie ein Profi, Googles Fabricius soll Hieroglyphen entziffern. Und die KI der Firma LawGeex überprüft in 30 Sekunden Rechtsdokumente, für die erfahrene Rechtsanwälte Stunden benötigen.

Noch sind diese Anwendungen weit von einem menschengleichen Textverständnis entfernt. Eine entsprechende Künstliche Intelligenz sollte zuverlässig Fragen beantworten, logische Zusammenhänge zwischen Einzelaussagen erkennen, sinngemäß übersetzen und Sätze zu Ende führen können. Doch Fortschritte der letzten Jahre, wie das Sprachmodell ELMo oder GPT-3, scheinen dieses Ziel ein Stück näher gebracht zu haben. Ende 2020 schlugen etwa die Sprach-KIs DeBERTa von Microsoft und T-5 von Google den Sprach-Benchmark SuperGLUE.

Schreiben

Die Commerzbank setzt KI für die Wertpapieranalyse ein, um Händlern bessere Kaufentscheidungen zu ermöglichen. Die Washington Post, New York Times, Reuters oder Associated Press lassen KI kurze Sport- und Wirtschaftsnachrichten verfassen. Und Amerikas größte US-Bank setzt zukünftig auf KI-generierte Werbeslogans.

Möglich ist das mit Künstlicher Intelligenz, die Texte generiert. Solche Text-KIs haben im letzten Jahr große Fortschritte gemacht. Insbesondere OpenAIs GPT-2 war prominent in den Nachrichten: Die Text-KI wurde erst sechs Monate nach der Ankündigung als Vollversion veröffentlicht, da OpenAI sie zunächst als gefährlich einstufte. Die vermutete Bedrohung: Missbrauch durch Spammer und Fälscher.

GPT-2 generiert zum Beispiel ein Text-Adventure, fragwürdige Rezepte oder vervollständigt Code. Besonders gut kann sie Fake-News erstellen: OpenAI veröffentlichte daher eine Browser-Software, die von GPT-2 erstellte Texte erkennen kann.

Diktieren statt programmieren: Entwickler Sharif Shameem macht sich die schnelle Auffassungsgabe von OpenAIs Sprach-KI GPT-3 zunutze und bringt ihr mit zwei Beispielen rudimentäre Web-Entwicklung bei.

Entwickler Sharif Shameem macht sich die schnelle Auffassungsgabe von OpenAIs Sprach-KI GPT-3 zunutze und bringt ihr mit zwei Beispielen rudimentäre Web-Entwicklung bei. Würde diese Entwicklung konsequent fortgesetzt, könnte man so in Zukunft vielleicht Webseiten diktieren statt programmieren. | Bild: Twitter / Shameem

Knapp ein Jahr später veröffentlichte OpenAI im Mai 2020 GPT-3: Das riesige Sprachmodell ist hundertmal größer und übertrifft die Leistungsfähigkeit des Vorgängers. Menschliche Tester erkennen den Unterschied zwischen KI-generierten und per Hand geschriebenen Texten nicht mehr und GPT-3 lernt neue Textaufgaben mit wenigen Beispielen ohne aufwendig nachtrainiert werden zu müssen. GPT-3 rasselt zwar immer noch durch den Turing-Test, schreibt aber Blog-Beiträge, die tausende Leser anziehen und war fast zwei Wochen lang unerkannt als Reddit-Autor unterwegs.

GPT-3 ist anders als GPT-2 nicht mehr Open-Source: OpenAI verkauft Zugänge zur Text-KI. Der OpenAI-Investor Microsoft kaufte sich gleich eine Exklusivlizenz mit Zugriff auf den Code der KI.

Grund ist die Leistungsfähigkeit und Flexibilität der KI, die schon kurz nach Veröffentlichung ihre Vielseitigkeit zur Schau stellte: Sie kann Code schreiben, Texte zusammenfassen, Philosophieren oder Fitnesstips geben. Das hat eine ganze Reihe KI-Gründer dazu veranlasst, sich auf die Suche nach der GPT-3-Killerapp zu begeben.

Denken

Die Fähigkeit zum logisch-symoblischen Denken gilt oft als Alleinstellungsmerkmal menschlicher Intelligenz. Sie war insbesondere Thema der frühen KI-Forschung. Die sogenannte „Good, Old-Fashoined AI“ (GOFAI) bestimmte die Forschung bis in die späten 1980er und schuf Expertensysteme, die Informationen über die Welt in symbolische Kategorien verpacken und mit ihnen logisch schlussfolgern.

Die GOFAI scheiterte an den eigenen Ansprüchen und das maschinelle Lernen startete seinen Siegeszug durch die KI-Forschung. Doch das Ziel einer denkenden Maschine haben die Forscher nie aus den Augen verloren.

Der richtige Weg zur denkenden Maschine ist umstritten: Geoffrey Hinton glaubt an Deep Learning, Gary Marcus an hybride Systeme und Yoshua Bengio meint zumindest drei Probleme zu kennen, die es auf dem Weg zu menschenähnlicher KI noch zu lösen gilt.

So oder so: Mit den Erfolgen aktueller Systeme in der Datenverarbeitung wie der Bildanalyse oder Verarbeitung natürlicher Sprache wenden sich KI-Forscher wieder verstärkt dem maschinellen Denken zu. Gary Marcus arbeitet etwa an einer „industriellen kogntiven Engine“, die als Grundlage für alltagstaugliche Roboter dienen soll.

Andere KI-Forscher versuchen derweil die prestigeträchtigste Domäne menschlichen Denkens zu automatisieren: die Forschung. Sie leiten etwa mit KI aus Daten neue Naturgesetze ab, lösen ein Grundlagenproblem der Quantenchemie oder sagen Proteinfaltungen so gut voraus, dass das Problem als gelöst gilt.

Auch das KI-Unternehmen Deepmind forscht am maschinellen Denken: Im Januar 2021 veröffentlichte Deepmind gleich zwei relevante Forschungsarbeiten. Die Forscher trainierten ein neuronales Netz, die Auswirkungen einfacher Objekte aufeinander zu verstehen. Die Ergebnisse zeigen laut Deepmind, dass neuronale Netze tatsächlich lernen können, über die „kausale, dynamische Struktur physikalischer Ereignisse nachzudenken.“

In einer weiteren Arbeit stellt Deepmind ein System vor, das symbolisch-kausale Theorien generiert, die Sinneseindrücke erklären können. Die „Apperzeptions-Maschine“ kann vorhersagen, Rückschlüsse ziehen und ausgelassene Informationen ergänzen – über viele verschiedene Aufgaben hinweg. Die Forscher bezeichnen ihre Maschine als einen Prototyp für eine universelle, domänenunabhängige sinnfindende Maschine.

Fühlen

KIs analysieren die Daten zahlreicher Sensoren in Robotern und lassen sie so fühlen. Die sonst eher grobmotorischen Maschinen können auf diese Art selbst empfindliche Früchte wie Himbeeren pflücken, den Reibungswiderstand eines Jenga-Blocks spüren oder weiche Gegenstände in Lagerhallen sortieren.

Feinfühlige Roboterfinger sind besonders im Zukunftsmarkt Haushalts- und Pflegerobotik notwendig. Dort sind viele Aufgaben ohne Gefühl unmöglich zu erledigen. Bis diese Roboter Wirklichkeit werden, wird es dauern: Sie stolpern noch über die „Realitätslücke“, die sich auftut, wenn in kontrollierten Simulationen trainierte Roboter plötzlich in komplexen realen Umgebungen handeln sollen.

Bis dahin müssen Roboter noch von Menschen unterstützt werden, etwa indem sie dem Roboterhund Spot Mini Anweisungen geben, bevor der sich dann eigenständig auf den Weg macht oder einen Katzenroboter in der virtuellen Realität fernsteuern. Immerhin kleine Fortschritte gibt es jedoch: Spot Mini kann seit Februar 2020 Wäsche sammeln und gärtnern.

Riechen

Gerüche sind Moleküle, die in die Chemorezeptoren unsere Nase gelangen. KI-Forscher fangen diese Moleküle mit künstlichen Rezeptoren auf und verarbeiten sie mit KI. So hat Google eine KI-Nase entwickelt, die fast 5.000 Gerüche erkennen kann. IBM experimentiert mit KI-generierten Parfums. Und eine KI russischer Forscher schnüffelt nach potenziell tödlichen Gasgemischen.

In der Medizin könnten die KI-Nasen ebenso eingesetzt werden: Künstliche Schnüffler sollen bald Krankheiten erkennen. Forscher entwickeln eine KI, die im Atem enthaltene Moleküle identifizieren und so Diabetes, Krebs, Gehirnschäden oder Parkinson erkennen soll.

Empathisch sein

Wenn wir schon mit digitalen Assistenten sprechen und uns von medizinischen Chatbots diagnostizieren lassen – wie wäre es dann mit einem KI-Psychotherapeuten? Erste Apps mit diesem Versprechen kann man herunterladen: WoeBot ist ein Chatbot, der Menschen mit Depressionen helfen soll, ihren Alltag zu meistern. Wysa ist vom gleichen Typ Chatbot und soll helfen, Emotionen und Gedanken zu kontrollieren.

Künstliche Intelligenz identifiziert Emotionen in Gesichtern. Ein Google-Tool zeigt wie das aussieht.

Künstliche Intelligenz identifiziert Emotionen in Gesichtern. Ein Google-Tool zeigt, wie das aussieht. Bild: Eigener Screenshot / Google

Doch wirkliche Empathie erfordert, dass Maschinen subtile Signale in Körpersprache und Worten erkennen. Hier helfen KIs, die Emotionen in Gesichtern, Chatnachrichten oder der Stimme identifizieren. Eine Gruppe Forscher konnte etwa zeigen, dass die Analyse von Facebook-Nachrichten bei der Früherkennung psychischer Krankheiten helfen kann. Die gleiche Technik kann im Marketing helfen, den Erfolg von Werbung zu verbessern oder Staaten erlauben, ihre Überwachungssysteme mit Emotionserkennung auszustatten.

Roboter-Empathie kann Forschern außerdem helfen zu verstehen, wie Empathie überhaupt ensteht. KI-Forscher der Columbia Universität New York haben etwa einen Roboter gebaut, der das Verhalten eines anderen Roboter vorhersagen kann. Die Forscher erklären diese Fähigkeit mit einer „Visual Theory of Behavior“, die sie als Baustein einer „Theory of Mind“ ansehen.

Kreativ sein

Dank der GAN-Methode, bei der sich zwei KI-Agenten gegenseitig zu Höchstleistungen anspornen, generiert KI immer bessere Fotos, Videos und Musik. Im Oktober 2018 versteigerte das Auktionshaus Christie’s erstmals KI-Kunst – für 432.000 US-Dollar.

Das Auktionshaus Christie's versteigerte erstmals KI-Kunst.

Das Auktionshaus Christie’s versteigerte erstmals KI-Kunst. Bild: Christie’s

Die für KI-Kunst notwendigen Werkzeuge sind für jeden verfügbar: Mit dem KI-Tool Ganbreeder generiert ihr aus unzähligen Bildkategorien neue, fantastische Kunstwerke. Und mit Nvidias GauGAN malt ihr Landschaften wie ein Profi. Beeindruckend ist die rasante Entwicklung der GAN-Technologie seit 2014.

Doch KI kann nicht nur malen: OpenAIs MuseNet mixt Musikstile. Eine KI japanischer Wissenschaftler generiert Melodien aus Songtexten. Und Dadabots KI schrubbt ununterbrochen Death Metal.

Ein Star-Wars-Künstler malt Landschaften mit Nvidias GauGAN.

Ein Star-Wars-Künstler malt Landschaften mit Nvidias GauGAN. Bild: Nvidia / Disney

Abseits der Kunst zeigt sich das Potenzial der KI-Kreativität ebenfalls: Erste KI-Patentanmeldungen stellen die Patentämter der Welt vor eine schwierige Frage: Wem gehört eine KI-Erfindung? Und die berüchtigten Deepfakes bringen nicht nur fantastische Deepfake-Videos hervor, sondern könnten Wahlen beeinflussen sowie Rachepornos verbreiten.

Facebook, YouTube und Twitter gehen vor allem im Hinblick auf den US-Wahlkampf aktiv gegen Deepfakes vor. Im September 2020 löschte Facebook 212 Fake-Accounts, die Deepfake-Profilfotos einsetzten und chinesische Propaganda verbreiteten.