Der Artikel kann nur mit aktiviertem JavaScript dargestellt werden. Bitte aktiviere JavaScript in deinem Browser und lade die Seite neu.
Wombo AI meldet sich mit „Wombo Dream“ zurück, einer KI-Kunst-App, die auf Knopfdruck surreale hochauflösende Bilder generiert – und dabei ziemlich genau offenlegt, welche Bilder Bestandteil des Trainingsmaterials waren.
Mit Werbeeinnahmen bezahlen wir unsere Redakteur:innen. Mit einem MIXED-Abo kannst Du unsere Seite werbefrei lesen.
Der erste große Wurf gelang dem kanadischen Entwicklungsteam Wombo AI mit der Deepfake-App Wombo: Sie animiert ein Foto eures Gesichts lippensynchron zu einem Song – inklusive maximal peinlicher Tanzbewegungen. Wombo wurde innerhalb kürzester Zeit Millionen Mal heruntergeladen und gehört zu den ersten großen westlichen Ein-Klick-Deepfake-Apps.
Wombo Dream: KI-Kunst mit einem Klick
Mit Wombo Dream stellt Wombo AI jetzt die zweite KI-Kunst-App vor: Sie generiert basierend auf einer Texteingabe von bis zu 100 Zeichen ein passendes Bild. KI-Puristen wählen die nackte Bildausgabe ohne zusätzlichen Bildstil – hier erlebt man ungefiltert die typisch hohe Abstraktionsebene von KI-Kunst mit teils starkem Kringel- und Horrorfaktor.
Ungefilterte KI-Kunst ist mitunter etwas hart für die Augen – hier ein Wiener Würstchen gepaart mit Max. | Bild: Wombo Dream / MIXED
Eine etwas präzisere Bildbeschreibung mit „Dog“ dazu sowie einem ergänzenden Filter erzeugt ein Bild, das man sich an die Wand hängen könnte. Wiener Dog und Wiener Würstchen sind klar erkennbar. | Bild: Wombo Dream / MIXED
Im ungefilterten Modus lässt sich außerdem deutlich herauslesen, welche Bilder Bestandteil des KI-Trainings waren. Nach meinen ersten Tests sind das ziemlich viele: Von Band-Logos über bekannte Fußballer bis hin zu Geschlechtsteilen kann Wombos Traum-KI so ziemlich jedes Wort mit Wiedererkennungswert abstrakt als Bild zurecht fantasieren. Jede neue Eingabe erzeugt ein neues Motiv – das macht süchtig.
Das „Metallica“-Logo war offensichtlich Bestandteil der KI-Trainingsdaten. | Bild: Wombo AI / MIXED
Ihr könnt die KI-Generierung mit einem der zahlreichen Bildstile wie „Dark Fantasy“ oder „Steampunk“ in eine etwas konkretere Richtung lenken. Die Stile beeinflussen Zeichenart, Farbgebung und Aufbau des Bildes. Bei Steampunk etwa generiert die KI meist Motive, die an komplexe Gebäude oder Maschinen erinnern, das zum Wort eingegebene Motiv aber dennoch widerspiegeln.
Der Input „Metallica“ in Kombination mit einem Filter erzeugt ein surreales Bühnenbild statt des Logos. Man erkennt Sänger, Gitarren und ein Schlagzeug. | Bild: Wombo AI / MIXED.de
GAN-Architektur ist Betriebsgeheimnis
Welche Technologie genau Wombo Dream verwendet, verrät das Entwicklungsstudio nicht. Schließen wir den unwahrscheinlichen Fall einer kompletten Eigenentwicklung aus, hat Wombo AI womöglich ein gelungenes Interface um OpenAIs KI-Modell CLIP mit VQGAN oder um ein ähnliches Modell gebaut. Mit zusätzlichen Trainingsdaten könnte Wombo AI das Modell für die verschiedenen Stile feinjustiert haben oder die Stile sind bereits im Datensatz enthalten.
Die von Wombo verwendete zugrundeliegende KI-Software ist als Open Source verfügbar, allein es fehlte an einer für alle leicht bedienbaren Oberfläche. Die hat Wombo AI mit der Dream-App geschaffen – und das kommt an: Im Google Play Store und in Apples App Store erzielt Dream hohe Bewertungen. Im App Store schießt die App auf Platz Nr. 1 in der Rubrik Grafik und Design. Alternativ könnt ihr Wombo Dream im Browser testen.
Hinweis: Links auf Online-Shops in Artikeln können sogenannte Affiliate-Links sein. Wenn ihr über diesen Link einkauft, erhält MIXED.de vom Anbieter eine Provision. Für euch verändert sich der Preis nicht.