Der Tech-Riese IBM hat Anfang des Jahres einen KI-Trainingsdatensatz für Gesichtserkennung veröffentlicht. Doch die Urheber der Fotos wissen nichts von ihrer Beteiligung.

KIs brauchen Trainingsdaten und zwar viele – aber woher kommen die? Meist stammen sie aus öffentlichen Datensätzen, die von staatlichen Institutionen, Forschungseinrichtungen oder großen Firmen zusammengestellt werden.

Beispiele sind das Statistische Bundesamt, die amerikanische Sammlung öffentlicher Daten „data.gov“ oder der Bild-Datensatz „ImageNet“, mit dem Google Bild-KIs trainiert.

Wer eine KI auf Gesichtserkennung trainieren will, braucht vor allem eines: Fotos von Gesichtern. Auch hier gibt es eine Vielzahl Datensätze. Der Gesichtserkennungsspezialist „Kairos“ führt in einem Blog-Beitrag aktuell 60 frei verfügbare Sätze auf.

Ist eine Gesichtserkennungs-KI trainiert, kann sie für verschiedene Aufgaben eingesetzt werden: iPhones entsperren, einzelne Personen in Menschenmengen erkennen, verschlossene Türen öffnen und mehr.

Fragwürdiger Ursprung der Fotos

Doch woher stammen die vielen Fotos in den Datensätzen? Die Antwort


Hinweis: Links auf Online-Shops in Artikeln können sogenannte Affiliate-Links sein. Wenn ihr über diesen Link einkauft, erhält MIXED.de vom Anbieter eine Provision. Für euch verändert sich der Preis nicht.