Facebook investiert in Künstliche Intelligenz, die aus Bildern von Gegenständen dreidimensionale Modelle erstellen kann. Das soll bei VR und AR helfen.

Wenn wir eine Tasse von vorne sehen, denken wir uns die Rückseite mit – egal, ob sie vor uns steht oder auf einem Foto zu sehen ist. Wir verstehen, dass unsere Welt drei räumliche Dimensionen hat.

Diese Fähigkeit hilft uns, Objekte zu identifizieren, auch wenn sie sich bewegen. Das wiederum ist die Grundlage für Orientierung und Navigation in unserer Umwelt.

Eine Künstliche Intelligenz, die Objekte in einem Foto als dreidimensional versteht, ist daher ein wichtiger Schritt zu genauerer Objekterkennung, Roboternavigation oder besseren Augmented-Reality-Apps.

Neue KI-Methode erkennt 3D in 2D

Facebook demonstriert eine neue KI, die wie das menschlich Gehirn eine 3D-Form aus einer 2D-Abbildung herleiten kann. “Mesh R-CNN” identifiziert ein Objekt in einem Bild und generiert ein passendes rudimentäres 3D-Modell.

Dafür erstellt die KI zuerst ein grobes Voxel-Modell, das sie dann im zweiten Schritt in ein feineres Polygon-Modell umwandelt. Das funktioniert auch bei komplexeren Objekten wie einem Stuhlbein oder sich gegenseitig verdeckenden Möbeln.

Trainiert wurde die KI mit passenden Bil…

MIXED.de XR-Podcast - jetzt reinhören

Aktuell: Coronavirus vs. VR-Arcades | Alle Folgen



Hinweis: Links auf Online-Shops in Artikeln können sogenannte Affiliate-Links sein. Wenn ihr über diesen Link einkauft, erhält MIXED.de vom Anbieter eine Provision. Für euch verändert sich der Preis nicht.