Inhalt
newsletter Newsletter
DEEP MINDS Podcast
Podcast über Künstliche Intelligenz und Wissenschaft
KI bei der Bundeswehr und der BWI | DEEP MINDS #16

Wombo AI meldet sich mit "Wombo Dream" zurück, einer KI-Kunst-App, die auf Knopfdruck surreale hochauflösende Bilder generiert - und dabei ziemlich genau offenlegt, welche Bilder Bestandteil des Trainingsmaterials waren.

Der erste große Wurf gelang dem kanadischen Entwicklungsteam Wombo AI mit der Deepfake-App Wombo: Sie animiert ein Foto eures Gesichts lippensynchron zu einem Song - inklusive maximal peinlicher Tanzbewegungen. Wombo wurde innerhalb kürzester Zeit Millionen Mal heruntergeladen und gehört zu den ersten großen westlichen Ein-Klick-Deepfake-Apps.

Wombo Dream: KI-Kunst mit einem Klick

Mit Wombo Dream stellt Wombo AI jetzt die zweite KI-Kunst-App vor: Sie generiert basierend auf einer Texteingabe von bis zu 100 Zeichen ein passendes Bild. KI-Puristen wählen die nackte Bildausgabe ohne zusätzlichen Bildstil - hier erlebt man ungefiltert die typisch hohe Abstraktionsebene von KI-Kunst mit teils starkem Kringel- und Horrorfaktor.

Ungefilterte KI-Kunst ist mitunter etwas hart für die Augen - hier ein Wiener Würstchen gepaart mit einem Wiener Dog, einem Dackel.
Ungefilterte KI-Kunst ist mitunter etwas hart für die Augen - hier ein Wiener Würstchen gepaart mit Max. | Bild: Wombo Dream / MIXED

 

Anzeige
Anzeige
Eine etwas präzisere Bildbeschreibung mit "Dog" dazu sowie einem ergänzenden Filter erzeugt ein Bild, das man sich an die Wand hängen könnte. Wiener Dog und Wiener Würstchen sind klar erkennbar. | Bild: Wombo Dream / MIXED

Im ungefilterten Modus lässt sich außerdem deutlich herauslesen, welche Bilder Bestandteil des KI-Trainings waren. Nach meinen ersten Tests sind das ziemlich viele: Von Band-Logos über bekannte Fußballer bis hin zu Geschlechtsteilen kann Wombos Traum-KI so ziemlich jedes Wort mit Wiedererkennungswert abstrakt als Bild zurecht fantasieren. Jede neue Eingabe erzeugt ein neues Motiv - das macht süchtig.

Das "Metallica"-Logo war offensichtlich Bestandteil der KI-Trainingsdaten. | Bild: Wombo AI / MIXED

Ihr könnt die KI-Generierung mit einem der zahlreichen Bildstile wie "Dark Fantasy" oder "Steampunk" in eine etwas konkretere Richtung lenken. Die Stile beeinflussen Zeichenart, Farbgebung und Aufbau des Bildes. Bei Steampunk etwa generiert die KI meist Motive, die an komplexe Gebäude oder Maschinen erinnern, das zum Wort eingegebene Motiv aber dennoch widerspiegeln.

Der Input "Metallica" in Kombination mit einem Filter erzeugt ein surreales Bühnenbild statt des Logos. Man erkennt Sänger, Gitarren und ein Schlagzeug. | Bild: Wombo AI / MIXED.de

GAN-Architektur ist Betriebsgeheimnis

Welche Technologie genau Wombo Dream verwendet, verrät das Entwicklungsstudio nicht. Schließen wir den unwahrscheinlichen Fall einer kompletten Eigenentwicklung aus, hat Wombo AI womöglich ein gelungenes Interface um OpenAIs KI-Modell CLIP mit VQGAN oder um ein ähnliches Modell gebaut. Mit zusätzlichen Trainingsdaten könnte Wombo AI das Modell für die verschiedenen Stile feinjustiert haben oder die Stile sind bereits im Datensatz enthalten.

Die von Wombo verwendete zugrundeliegende KI-Software ist als Open Source verfügbar, allein es fehlte an einer für alle leicht bedienbaren Oberfläche. Die hat Wombo AI mit der Dream-App geschaffen - und das kommt an: Im Google Play Store und in Apples App Store erzielt Dream hohe Bewertungen. Im App Store schießt die App auf Platz Nr. 1 in der Rubrik Grafik und Design. Alternativ könnt ihr Wombo Dream im Browser testen.

Derzeit ist Wombo Dream noch werbefrei und die Bildgenerierung ist schnell und kostenlos. Das dürfte nicht so bleiben.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Empfehlung

Weiterlesen und hören über KI-Kunst:

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!