Google stellt eine neue Übersetzungs-KI vor, die neben weit verbreiteten auch seltene Sprachen übersetzt – derzeit sind es mehr als 100.

Online-Services von Google, DeepL und Co. übersetzen mittlerweile auf hohem Niveau – jedoch nur in den Sprachen, in denen viele Übersetzungsbeispiele existieren. Die KIs werden nämlich meist mit Satzpaaren trainiert, etwa einem deutschen Satz und seinem englischen Gegenstück. Aus vielen Beispielen kann die Künstliche Intelligenz so das Übersetzen lernen.

Eine Sprache, die seltener gesprochen wird oder von der wenig Übersetzungen in eine weit verbreitete Sprache existieren, ist daher ein Problem für eine Übersetzungs-KI: Das Trainingsmaterial fehlt. Häufig wird dennoch versucht, mit den wenigen verfügbaren Satzpaaren ein ordentliches Ergebnis zu erzielen, etwa bei Bibelübersetzungen. So entstehen seltsame Sprachblüten, die mit dem ursprünglichen Satz nicht mehr viel zu tun haben.

Die Regel ist also: Je mehr Satzpaare existieren, desto besser ist die Übersetzung.

Big Data als Lösung: Alle Sprachen in einen Topf

Google will diesem Engpass mit einem “massiv mehrsprachigen Modell” begegnen: Die KI lernt nicht zwei Sprachen, sondern wird mit mehr als 25 Milliarden Satzpaaren aus über 100 Sprachen trainiert. Die Hoffnung der Forscher ist, dass sich so die Erfolge aus der Übersetzung von Sprachen…

MIXED.de XR-Podcast - jetzt reinhören

Aktuell: Half-Life: Alyx ohne Spoiler | Alle Folgen



Hinweis: Links auf Online-Shops in Artikeln können sogenannte Affiliate-Links sein. Wenn ihr über diesen Link einkauft, erhält MIXED.de vom Anbieter eine Provision. Für euch verändert sich der Preis nicht.