"Hey Google": Google Assistant hört künftig besser

Die Sprach-KI soll künftig besser auf „Hey Google“ reagieren und versehentliche Aufnahmen vermeiden. Wie funktioniert das?

Sprach-KIs wie der Google Assistant oder Amazons Alexa (Guide) lassen sich durch die sogenannten „Wake-Words“ aktivieren. Standardmäßig sind das beispielsweise „Hey Google“ oder „Alexa“. Nehmen sie diese Signalworte wahr, beginnen sie mit der Aufzeichnung, um mögliche Sprachbefehle zu verstehen und auszuwerten.

Gerade in aktuellen Smart Speakern wie Echo 4 (Test) oder dem kommenden Google-Smart-Display Nest Hub 2 (Infos) sind speziell auf die Spracherkennung eingestellte Mikrofone verbaut. Manchmal kommt es allerdings immer noch zu Missverständnissen, wenn die Assistenten ähnlich klingende Worte für das Aktivierungswort halten.

Google will die eigene Spracherkennung verbessern und die versehentlichen Aktivierungen seines Sprachassistenten einschränken.

Föderales Lernen soll den Google Assistant verbessern

Berichten zufolge erhalten manche US-Nutzer eine neue Option in ihren Google-Assistant-Einstellungen. Dort soll es nun möglich sein, den Assistenten mit bestimmten Audioaufnahmen beim Lernen zu unterstützen. Google beschreibt die „Help improve Assistant“-Option folgendermaßen:

„Ihre Audioaufnahmen bleiben auf Ihrem Gerät, während eine datenschutzfreundliche Technologie Informationen von Ihnen und vielen anderen Teilnehmern kombiniert, damit Assistant mit der Zeit lernt und bessere intelligente Funktionen entwickelt.“

Das Smart-Display Google Nest Hub der zweiten Generation. — Auf Smart-Displays wie dem Google Nest Hub 2 steuert der Google Assistant beinahe das komplette Smart Home. | Bild: Google

Die Aufnahmen sollen Google helfen, die Signalworterkennung in zwei Fällen zu verfeinern:

Wenn sich Google Assistant aktiviert, obwohl Nutzer nicht „Hey Google“ gesagt haben.
Wenn sich Google Assistant nicht aktiviert, obwohl Nutzer „Hey Google“ gesagt haben.

Google nutzt dazu eine Methode namens „föderales Lernen“. Dabei werden Rohdaten lokal verarbeitet. Die verschlüsselten Audiodateien bleiben also auf den Geräten. Es wird nur eine Zusammenfassung an Metadaten zu den Google-Servern geschickt, mit der die Auslöselogik des Assistenten angepasst werden kann.

Die Option bleibt standardmäßig deaktiviert. Entscheiden sich Nutzer sie einzuschalten, speichert das Gerät täglich bis zu zwanzig dieser Aufnahmen. Sie werden automatisch gelöscht, sobald sie nicht mehr benötigt werden, spätestens jedoch nach 63 Tagen.

Empfehlung

KI-Forschung

OpenAIs atemberaubendes Video-Generation-Debüt Sora fühlt sich an wie ein GPT-4-Moment

Google Assistant nähert sich EU-Privatsphäre-Richtlinien an

Erst vor Kurzem veröffentlichte die europäische Datenschutzbehörde (EDPB) eine erste Version ihrer Privatsphäre-Richtlinien für Sprachassistenten. Darin forderte sie unter anderem, die versehentliche Aktivierung der Assistenten zu verbessern.

Hersteller sollten auf technischer Ebene sicherstellen, dass sich Sprach-KIs nicht durch ähnlich klingende Laute aktivieren lassen. Die EDPB schlug beispielsweise Rauschfilter vor, die Nutzerstimmen besser von Umgebungsgeräuschen trennen würden.

Durch die Verbesserung der eigenen Künstlichen Intelligenz könnte Google den Richtlinien bei Inkrafttreten zumindest im Bereich der Spracherkennung entsprechen. Ob Google die neue Lern-Option überhaupt für Nutzer außerhalb der USA freischaltet, ist nicht bekannt.

Titelbild: Google, Quelle: 9to5Google