Inhalt
newsletter Newsletter
DEEP MINDS Podcast
Podcast über Künstliche Intelligenz und Wissenschaft
KI bei der Bundeswehr und der BWI | DEEP MINDS #16

Mit Künstlicher Intelligenz will Google Bilder im Internet für blinde Menschen hörbar machen. Schon mehr als zehn Millionen Bilder wurden automatisch beschriftet.

Im Internet gibt's Millionen Bilder, aber nur wenige davon sind mit beschreibendem Text hinterlegt. Den benötigen Screenreader allerdings, um den Inhalt eines Bildes in Sprachausgabe oder Braillezeile auszugeben.

Die Folge: Der Inhalt von Bildern bleibt blinden oder sehbehinderten Menschen häufig verwehrt. Im schlimmsten Fall erschließt sich dann der Inhalt einer Webseite nicht mehr.

Google möchte dieses Problem mit einer auf Objekterkennung in Bildern trainierten KI lösen: Die Funktion heißt "Get image descriptions on Chrome" und steht ab sofort in englischer Sprache für Nutzer mit Screenreader bereit. Sie kann in den erweiterten Einstellungen unter Bedienungshilfen aktiviert werden.

Anzeige
Anzeige

KI-Modelle kooperieren für die Bildanalyse

Ist die Option aktiviert, wird ein unbeschriftetes Bild an einen Google-Server geschickt. Dort wird es laut Google von mehreren KI-Modellen auf Text im Bild sowie auf Objekte untersucht. Das anspruchsvollste Modell könne das grundlegende Motiv eines Bildes in einem Satz beschreiben.

Auf diesem Bild erkannt: "Appears to be: Person playing guitar on the sofa." Bild: Google
Auf diesem Bild erkannt: "Appears to be: Person playing guitar on the sofa." Stimmt. Details wie das Geschlecht, die Farbe des Sofas oder das Notebook fehlen zwar, allerdings ist das besser als gar keine Beschreibung. Bild: Google

Die KI-Modelle evaluieren ihre Beschreibungen gegenseitig: Eine Beschreibung soll nur ausgegeben werden, wenn die Modelle einigermaßen sicher sind, dass sie passend ist. Bei Unsicherheit wird eine möglichst einfache oder gar keine Beschreibung ausgegeben.

KI für Blinde: Google Chrome liest jetzt Bilder vor
"Appears to be: Fruits and vegetables at the market." Die Bildidee wird wiedergegeben, die Details, nämlich die Früchte selbst, noch nicht. Außerdem ist kein Gemüse im Bild. Bild: Google

Die Beschreibungen seien zwar noch nicht so gut wie jene von Menschen, schreibt Google, sie könnten aber akkurat und hilfreich sein. In den letzten Monaten seien bei Tests mehr als zehn Millionen Bildbeschreibungen generiert worden. Jeden Tag würden hunderttausende hinzugefügt. Unterstützung für weitere Sprachen soll bald folgen.

Eine ähnliche KI-Software stellte Microsoft kürzlich fürs Smartphone vor: Sie erkennt Personen oder Objekte nach Berührung und liest die dazu passenden Begriffe vor. Allerdings funktionierte sie bei Veröffentlichung nur mäßig.

Quelle: Google

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Empfehlung

Weiterlesen über Künstliche Intelligenz:

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!