Google nutzt evolutionäre Algorithmen, um neue Videoanalyse-KIs zu entwickeln. Die dabei entstandenen “Tiny Video Networks” sind schneller, besser und sparsamer als aktuelle KI. Praktisch ist das für den Einsatz mit Robotern oder Smartphones.

Videoanalyse ist eine harte Aufgabe für Künstliche Intelligenz, die Zusammenhänge zwischen den einzelnen Bildern eines Videos erfassen muss. Die dadurch entstehende zeitliche Dimension erfordert große Netzwerke, die langsam sind und viel Energie verbrauchen.

Bisher wird die Architektur solcher Netze noch immer per Hand entworfen. In anderen Bereichen ist die KI-Forschung mittlerweile zur automatischen, fortlaufenden Suche nach besseren Netzwerk-Architekturen übergangen. Waymo und Deepmind nutzen solche evolutionären Entwicklungsmethoden beispielsweise, um autonome Autos besser sehen zu lassen.

KI-Evolution für effizientere Algorithmen

Google nutzt jetzt ebenfalls diese sogenannten evolutionären Algorithmen: Sie generieren mehrere KI-Architekturen und lassen sie miteinander konkurrieren. Beispielsweise durchlaufen sie einen Test bei der Bilderkennung. Die erfolgreichere Architektur wird weitergeführt, die andere verworfen.

Schneidet eine KI überdurchschnittlich gut ab, erstellt der evolutionäre Algorithmus modifizierte Kopien der Architektur und schickt sie erneut in den Wettbewerb. Das Vorgehen ist von Darwins Evolutionstheorien inspiriert.

Für die Videoanalyse entwickelte Googles evolutionärer Algorithmus “EvaNet” mehrere Bauteile, die er frei innerhalb der KI-Architekturen austauschte und anschließend bewertete.

Die so entstandenen Architekturen zeigen bei der Videoanalyse eine höhere Leistung als die aktuell besten KIs in diesem Bereich. Der Energiebedarf ist jedoch ähnlich hoch.

Eine Visualisierung von EvaNet in Aktion: Jede Box (groß und klein) entspricht einer Schicht im Netzwerk. Verschiedene Farben entsprechen verschiedenen Typen, etwa 3D Convolutional Neural Network (blau).

Klein, schnell und sparsam

Google ließ daher einen zweiten evolutionären Algorithmus laufen, der gezielt nach Architekturen filtert, die ähnliche Leistung bei geringerem Rechenaufwand bringen.

Das Ergebnis sind die “Tiny Video Networks”: Sie sollen im Durchschnitt “hundertmal schneller” sein als von Menschen entworfene Videoanalyse-KIs, schreibt Google.

Die TinyVideoNets (TVN) brauchen wesentlich weniger Rechenpower bei gleichbleibender Genauigkeit. Bild: Google.

Die TinyVideoNets (TVN) brauchen wesentlich weniger Rechenpower bei gleichbleibender Genauigkeit. Bild: Google.

Videoanalyse-KIs machen so dank evolutionärer Algorithmen einen deutlichen Sprung beim Energieverbrauch. Besonders die kleinen, schnellen Varianten werden dringend gebraucht: Videoanalyse in Echtzeit ist für Roboter das, was für uns das Sehen ist und könnte Echtzeit-Videoanalyse auch auf Smartphones ermöglichen.

Quelle: Google

Weiterlesen über Künstliche Intelligenz:

steady2

Der MIXED.de XR-Podcast #177

Jetzt reinhören: Facebook OS, Quest-Handtracking und VR-Kino | Alle Folgen



Hinweis: Links auf Online-Shops in Artikeln können sogenannte Affiliate-Links sein. Wenn ihr über diesen Link einkauft, erhält MIXED.de vom Anbieter eine Provision. Für euch verändert sich der Preis nicht.