Baidus künstlichem neuronalen Netz “Deep Voice” reichen wenige Sekunden Ausgangsmaterial, um eine Stimme zu klonen.

Forscher des chinesischen Suchmaschinenunternehmens Baidu stellen ein Klonverfahren vor, das nur wenige Sekunden Ausgangsmaterial braucht, um eine Stimme glaubhaft digital zu reproduzieren.

Dass das System so schnell arbeitet, ist die Besonderheit: Vor einem Jahr sollen für ein ähnliches Ergebnis noch rund 30 Minuten Trainingsmaterial notwendig gewesen sein. Ein 2016 von Adobe vorgestelltes Stimmklonverfahren benötigte rund 20 Minuten Trainingsmaterial, klingt allerdings besser.

Baidus KI-Klonstimme kann mittels Text-zu-Sprache-Software jede erdenkliche Aussage mit der Intonation und in der Stimmlage des Originalsprechers wiedergeben, unabhängig vom Inhalt der Aussage, mit der sie trainiert wurde.

Noch klingt diese Stimmreproduktion nicht perfekt: Sie ist eindeutig als computergenerierte Stimme zu erkennen, da sie mit Störgeräuschen und Verzerrungen überlagert ist. Konzentriert man sich j…

MIXED.de Podcast: VR, AR und KI - jede Woche neu

Jetzt reinhören: Alle Folgen


Hinweis: Links auf Online-Shops in Artikeln können sogenannte Affiliate-Links sein. Wenn ihr über diesen Link einkauft, erhält MIXED.de vom Anbieter eine Provision. Für euch verändert sich der Preis nicht.