GAN-Netzwerke beweisen erneut ihr schöpferisches Potenzial: Eine KI verpasst Songtexten passende Melodien.

Ihr seid gute Poeten, aber habt keine Musik im Blut? Dank zweier Wissenschaftler aus Japan und der Schweiz steht euch vielleicht doch noch eine Karriere in der Musikindustrie offen. Die Forscher haben eine KI trainiert, die Melodien aus Texten generiert.

Für das Training nutzten die Forscher insgesamt etwa 12.000 mit Songtexten verknüpfte MIDI-Dateien. Für ihre KI-Architektur verwendeten sie die von Deepfakes bekannten GAN-Netzwerke.

Das Generator-Netzwerk der GAN-KI versucht zu gegebenen Songtexten Melodien zu erzeugen, das Diskriminator-Netzwerk vergleicht diese mit den Trainingsdaten. Liegt das Klangergebnis weit ab der von Menschen komponierten Musik, verwirft der Diskriminator die KI-Musik – und der Generator muss erneut ran.

Der Generator erzeugt MIDI-Sequenzen, der Diskriminator bewertet sie. Diese Arbeitsteilung ist von Deepfakes bekannt. Bild: Yu et al.

MIXED.de Podcast: VR, AR und KI - jede Woche neu

Jetzt reinhören: Alle Folgen


Hinweis: Links auf Online-Shops in Artikeln können sogenannte Affiliate-Links sein. Wenn ihr über diesen Link einkauft, erhält MIXED.de vom Anbieter eine Provision. Für euch verändert sich der Preis nicht.