Mit Künstlicher Intelligenz will Google Bilder im Internet für blinde Menschen hörbar machen. Schon mehr als zehn Millionen Bilder wurden automatisch beschriftet.

Im Internet gibt’s Millionen Bilder, aber nur wenige davon sind mit beschreibendem Text hinterlegt. Den benötigen Screenreader allerdings, um den Inhalt eines Bildes in Sprachausgabe oder Braillezeile auszugeben.

Die Folge: Der Inhalt von Bildern bleibt blinden oder sehbehinderten Menschen häufig verwehrt. Im schlimmsten Fall erschließt sich dann der Inhalt einer Webseite nicht mehr.

Google möchte dieses Problem mit einer auf Objekterkennung in Bildern trainierten KI lösen: Die Funktion heißt “Get image descriptions on Chrome” und steht ab sofort in englischer Sprache für Nutzer mit Screenreader bereit. Sie kann in den erweiterten Einstellungen unter Bedienungshilfen aktiviert werden.

KI-Modelle kooperieren für die Bildanalyse

Ist die Option aktiviert, wird ein unbeschriftetes Bild an einen Google-Server geschickt. Dort wird es laut Google von mehreren KI-Modellen auf Text im Bild sowie auf Objekte untersucht. Das anspruchsvollste Modell könne das grundlegende Motiv eines Bildes in einem Satz beschreiben.

Auf diesem Bild erkannt: "Appears to be: Person playing guitar on the sofa." Bild: Google

Auf diesem Bild erkannt: “Appears to be: Person playing guitar on the sofa.” Stimmt. Details wie das Geschlecht, die Farbe des Sofas oder das Notebook fehlen zwar, allerdings ist das besser als gar keine Beschreibung. Bild: Google

Die KI-Modelle evaluieren ihre Beschreibungen gegenseitig: Eine Beschreibung soll nur ausgegeben werden, wenn die Modelle einigermaßen sicher sind, dass sie passend ist. Bei Unsicherheit wird eine möglichst einfache oder gar keine Beschreibung ausgegeben.

KI für Blinde: Google Chrome liest jetzt Bilder vor

“Appears to be: Fruits and vegetables at the market.” Die Bildidee wird wiedergegeben, die Details, nämlich die Früchte selbst, noch nicht. Außerdem ist kein Gemüse im Bild. Bild: Google

Die Beschreibungen seien zwar noch nicht so gut wie jene von Menschen, schreibt Google, sie könnten aber akkurat und hilfreich sein. In den letzten Monaten seien bei Tests mehr als zehn Millionen Bildbeschreibungen generiert worden. Jeden Tag würden hunderttausende hinzugefügt. Unterstützung für weitere Sprachen soll bald folgen.

Eine ähnliche KI-Software stellte Microsoft kürzlich fürs Smartphone vor: Sie erkennt Personen oder Objekte nach Berührung und liest die dazu passenden Begriffe vor. Allerdings funktionierte sie bei Veröffentlichung nur mäßig.

Quelle: Google

Weiterlesen über Künstliche Intelligenz:


MIXED-Podcast #165: Die Zukunft von Oculus | Alle Folgen


Links auf Online-Shops in Artikeln können sogenannte Affiliate-Links sein. Wenn ihr über diesen Link einkauft, erhält MIXED.de vom Anbieter eine Provision. Für euch verändert sich der Preis nicht.