Bochum. Ein Bochumer Forscherteam der Ruhr-Uni Bochum hat untersucht, wann Sprachassistenten zuhören. Dabei erlebten sie manch böse Überraschung.
Alexa, Siri und Cortana: Sprachassistenten sind aus vielen Haushalten nicht mehr wegzudenken. Die Lautsprecher mit eingebautem Computer und Mikrofon können Fragen zum Wetter beantworten, Musik von Streamingdiensten abspielen oder Kalendereinträge anlegen. Die Assistenten hören auf ihre Aktivierungsworte – oder auch Trigger genannt. Sagt ein Nutzer zum Beispiel „Hey Siri“ aktiviert sich der Assistent und führt Kommandos aus. Doch sie springen nicht nur bei ihren Triggern an, sondern auch bei vielen anderen Wörtern.
Welche Wörter Sprachassistenten versehentlich anspringen lassen, haben Forscherinnen und Forscher der Ruhr-Universität Bochum (RUB) und des Bochumer Max-Planck-Instituts (MPI) für Cybersicherheit und Schutz der Privatsphäre untersucht. Sie erstellten eine Liste von englischen, deutschen und chinesischen Begriffen, die von verschiedenen Sprachassistenten wiederholt als Aufforderung zum Zuhören fehlinterpretiert wurden.
Immer wenn die Systeme anspringen, schneiden sie eine kurze Sequenz des Gesagten mit und übermitteln die Daten an den Hersteller, teilweise ohne dass die Nutzerinnen und Nutzer das bemerken. Die mitgelieferten Audioschnipsel werden dann von Angestellten der Konzerne transkribiert und überprüft, um solche Fehltrigger in der Zukunft zu vermeiden. So können Fetzen von sehr privaten Unterhaltungen bei Firmen landen.
1000 Audiosequenzen, die Sprachassistenten fälschlicherweise triggern
In dem Experiment sollte eine typische Situation im Wohnzimmer nachgestellt werden: Die Forscherinnen und Forscher spielten den Assistenten stundenlang Audiomaterial auf verschiedenen Sprachen vor, unter anderem Folgen aus den Serien „Game of Thrones“, „Modern Family“ und „Tatort“. „Wir haben an jedem Speaker einen Sensor befestigt. Dann konnten wir sehen, wann der Leuchtring angeht“, erklärt Lea Schönherr, wissenschaftliche Mitarbeiterin an der RUB. Sobald ein Wort den Assistenten aktiviert, leuchtet der Ring auf. Das registrieren die Sensoren. „Das Ganze wurde dann noch zusätzlich über Aufnahmen via Webcam verifiziert“, sagt die Forscherin.
Auch interessant
Aus diesen Daten erstellte das Team eine erste Liste von über 1000 Sequenzen, die Sprachassistenten fälschlicherweise triggern. Im Deutschen lässt sich Amazon beispielsweise durch „Am Sonntag“ und Siri durch den Begriff „Daiquiri“ täuschen. „Gerade bei Wörtern wie Computer, was sehr häufig im alltäglichen Sprachgebrauch verwendet wird, kann es also zu Fehltriggern kommen. Wir haben auch beobachtet, dass in den Nachrichten von Bränden im Amazonas-Regenwald berichtet wurde, die dann natürlich das Wake-Word Amazon triggern“, so Schöhnherr. Dass die Assistenten auch auf Fehltrigger reagieren, liege daran, dass sie möglichst immer auf das Schlüsselwort reagieren sollten – egal, wer es ausspricht. Schönherr: „Dadurch, dass die Lautsprecher dann aber sehr liberal eingestellt sind, kann es dazu kommen, dass ähnliche Worte als Schlüsselwort missverstanden werden“.
Sprachassistenten werden auch im öffentlichen Raum eingesetzt
Sprachassistenten ziehen nicht nur in Wohnzimmer ein, immer häufiger werden sie auch im öffentlichen Raum installiert, um Fragen von Touristen oder Kunden zu beantworten. Bochum Marketing hat in Bochum vier Sprachassistenten aufgestellt, zum Beispiel in der Bochum Touristinfo und im Tierpark Bochum. Die kleinen Lautsprecher geben beispielsweise Informationen über Ausgehmöglichkeiten und Sehenswürdigkeiten in der Stadt. Sie beantworten aber auch allgemeine Anfragen.
Der Datenschutz wurde im Vorhinein überprüft. So sei Bochum Marketing auch mit Amazon in Kontakt getreten. „Der Aufstellung gingen mehrere Tests, auch durch und mit unseren Datenschutzbeauftragten, voraus. Diese haben ergeben, dass der Aufnahmeradius der Geräte durch den Aufbau der Säulen sehr gering ist, sodass in der Regel nur die Stimme bzw. das unmittelbare Umfeld nach der deutlichen Aussage des Aktivierungswortes verarbeitet wird. Verantwortlich für die eigentliche Aufnahme und dessen Verarbeitung ist Amazon. Dies ist auf den Informationshinweisen an den Säulen zu erkennen“, teilt Bochum Marketing auf WAZ-Anfrage mit.
Sprachassistenten lassen sich einfach ausschalten
So häufig wird der Sprachassistent der Stadt Bochum genutzt
Der sogenannte Alexa-Skill „Stadt Bochum“ kann nicht nur an den vier Standpunkten in Bochum genutzt werden. Skills sind Mini-Apps, die den Funktionen von Alexa erweitern.
Auch mit dem eigenen Sprachassistenten kann man sich über Sehenswürdigkeiten, Stadtführungen oder Veranstaltungen in Bochum informieren. Im Zeitraum vom 13.10.2019 bis zum 12.01.2020 wurden insgesamt 1195 Fragen gestellt, circa 85 pro Woche.
Bochum Marketing erhalte im Skill lediglich die transkribierte Aussagen – wie jeder andere Skill-Hersteller auch. Die Sprachaufzeichnungen, die zwangsweise zwischengespeichert werden, würden in regelmäßigen Abständen gelöscht und nicht angehört. „Da die Stelen an öffentlichen Orten stehen und vor allem für allgemeine Anfragen gedacht sind, werden hier auch keine sensiblen Informationen gegeben oder verarbeitet. Es liegt somit in der Bedienung des Nutzers, welche Daten eingegeben werden“, teilt Pressesprecher Christian Gerlig mit. Wer nicht möchte, dass die Geräte nach ihren Trigger-Worten lauschen, kann die Sprachassistenten einfach ausschalten. „Es gibt bei allen Assistenten einen Knopf, den man ausstellen kann“, sagt Lea Schönherr.