Wenn es nach Google geht, dann ist die Kamera längst mehr als eine Fotomaschine. In Kombination mit KI soll sie die Grundlage für eine neue Computerära legen.

Laut Googles-Managerin Aparna Chennaprapagada, verantwortlich für Lens und Augmented Reality, sind bis zu 15 Prozent der Smartphone-Fotos Alltags- und Erinnerungshilfen: Zum Beispiel wird die Einkaufsliste fotografiert oder ein Produkt im Schaufenster.

Googles Bildanalyse-KI soll dieser Entwicklung Rechnung tragen: Die kürzlich überarbeitete App für iOS und Android schlägt die Brücke zwischen fotografierten Objekten, Googles enormer Bilddatenbank im Netz und der vielen Milliarden Suchanfragen.

Die KI erkennt ein Objekt in einem Foto und verknüpft es mit einer passenden Suchanfrage. Als Resultat erhält man Informationen direkt zum Motiv oder zu vergleichbaren Objekten. Lens kann Bilder sowohl in Echtzeit als auch nachträglich analysieren. Das funktioniert in der Praxis meist schnell und zuverlässig.

Zu Aussetzern neigt die Bildanalyse, wenn ein Motiv in Bewegung, bei schwierigen Lichtbedingungen – zum Beispiel mit vielen Schatten – oder aus ungewöhnlichem Winkel fotografiert wird. Zukünftig will Google den Algorithmus daher intensiver mit typischen Smartphone-Aufnahmen trainieren.

Objekterkennung als technische Grundlage für Augmented Reality

Die auf Googles Open Source KI-Framework Tensorflow gebaute App erkennt laut Google über eine Milliarde Objekte. Zum Marktstart vor einem Jahr waren es noch rund 250 Millionen. Die Erkennungsrate konnte unter anderem durch eine verbesserte Textanalyse gesteigert werden: Die App liest Beschriftungen an Produkten und lernt so neue Zusammenhänge.

Texte können außerdem direkt aus der App heraus digital gespeichert und editiert werden. Auch Live-Übersetzungen sind denkbar zum Beispiel von Straßenschildern.

Für Chennaprapagada steht fest, dass die Kamera in Kombination mit Künstlicher Intelligenz eine neue Computerära starten wird: Maschinelles Lernen, schnellere Hardware und eine große Nutzerbasis, die reichlich Fotos schießt, sollen kombiniert eine fortschrittliche Augmented Reality mit Objekterkennung und Wegweisung ermöglichen. Was Google und Chennaprapagada dazu noch fehlt, ist das passende virtuelle Interface.

Weiterlesen über Google-KI:


MIXED-Podcast #165: Die Zukunft von Oculus | Alle Folgen


Links auf Online-Shops in Artikeln können sogenannte Affiliate-Links sein. Wenn ihr über diesen Link einkauft, erhält MIXED.de vom Anbieter eine Provision. Für euch verändert sich der Preis nicht.