Inhalt
newsletter Newsletter

Die Objekterkennung von Microsofts KI-App "Seeing AI" soll blinden und sehbehinderten Menschen den Alltag erleichtern.

Im März stellte Microsoft eine neue Version der KI-App "Seeing AI" vor: Sie kann über die Smartphone-Kamera Objekte erkennen und diese beim Namen nennen oder sogar beschreiben.

Das funktioniert auch im Web: Tippt man auf ein Foto, analyisert die KI das Bild, zerlegt es seine Bestandteile und beschreibt diese, zum Beispiel Mensch, Hund, Wiese. Sogar das Aussehen von Menschen und Emotionen in ihren Gesichtern soll die KI beschreiben können.

Ob KI das Alter eines Menschen besser schätzen lernt als der Mensch selbst? Bild: Microsoft
Ob KI das Alter eines Menschen besser schätzen lernt als der Mensch selbst? Bild: Microsoft

Theoretisch könnten - und sollten - diese Bildbeschreibungen von Webmastern direkt den Bilddateien hinzugefügt werden, um sehbehinderten Menschen das Surfen im Web zu erleichtern. Praktisch passiert das noch zu selten. Auch Google setzt daher auf Künstliche Intelligenz im Chrome-Browser, um sehbehinderten Menschen Bilder verlässlich vorlesen zu können.

Anzeige
Anzeige

KI: "So klug wie ein dreijähriges Kind"

Im Alltag gibt es natürlich keine Textbeschreibungen, die optional gepflegt werden können. Gerade hier könnte die KI-gestützte Objekterkennung für Menschen mit Sehbehinderung eine große Erleichterung sein - wenn sie denn mal verlässlich funktioniert.

Bei Seeing AI ist das in der aktuellen Version, die jetzt neben Englisch auch Deutsch, Französisch, Spanisch, Niederländisch und Japanisch unterstützt, noch nicht der Fall.

Im Interview mit dem Spiegel sagt Saqib Shaikh, Chefentwickler von Seeing AI, dass Computer noch "viele Jahre" davon entfernt seien, sich umschauen und alles verstehen zu können, was sie sehen - trotz "riesiger Fortschritte" bei der KI-Entwicklung.

"Ich bin selbst blind und gehe daher gerne mit meiner Frau und meinen Freunden spazieren. Wir diskutieren dann darüber, was sie unterwegs sehen", sagt Shaikh. "Sie sagen mir dann, wenn sie etwas Spannendes entdecken, oder ich frage nach, wenn ich ein Geräusch nicht zuordnen kann. Ich wünsche mir, dass eine KI genau das eines Tages übernehmen kann. Wie ein persönlicher Assistent."

Ob das in zwei oder fünf Jahren erreicht werden kann, darauf will sich Shaikh nicht festlegen: "Es passiert so viel auf dem Gebiet. Jedes Jahr gibt es einerseits so viele Fortschritte, andererseits stoßen wir aber auch auf extrem große Herausforderungen." Eine KI, die die Umgebung versteht, wäre auch für andere Zukunftstechnologien wie Augmented Reality oder selbstfahrende Autos grundlegend.

Empfehlung

KI sei derzeit wie ein dreijähriges Kind, dem man die Welt erklären müsse. Allerdings würde KI wie ein Kind "mit der Zeit besser". Seeing AI bezeichnet er explizit als "sehr experimentelles" Forschungsprojekt.

Herunterladen kann man Seeing AI kostenlos für iOS (iPad & iPhone).

Titelbild: Microsoft

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Weiterlesen über Künstliche Intelligenz:

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!