DolphinAttack im Video
Lautlos aktiviert: Siri-Angriff im nicht hörbaren Bereich
Kennt ihr die Sprachbanane? Falls nicht, könnt ihr hier einen Blick auf das Hörflächen-Schaubild werfen, das die Grundtöne unserer Sprache im Verhältnis zu Pegel und Tonhöhe darstellt.
Viel besser noch als die Faustregel „Menschen hören Töne, derer Frequenz zwischen 20Hz und 20.000Hz liegt“ bildet die Sprachbanane den Lautstärke- und Frequenzbereich ab, in dem gesprochene Sprache am häufigsten zu finden ist. Und was macht die Banane gerade relevant? Dieser Siri-Angriff eines chinesischen Forscher-Teams.
Unter Laborbedingungen ist es sechs Forschern der Zhejiang Universität gelungen, mehrere Sprachassistenz-Systeme – darunter Siri, Alexa und den Google Assistent – mit Sprachkommandos im nicht-hörbaren Bereich zu aktivieren.
Die Forscher, die ihr Experiment als „DolphinAttack“ beschreibe (PDF), haben herkömmliche Sprachbefehle digital manipuliert und diese mit speziellen Frequenz-Effekten versehen, so dass die Sätze in einen Frequenzbereich oberhalb von 20.000Hz moduliert wurden.
Zwar können Menschen die Befehle anschließen nicht mehr wahrnehmen, die in iPhone und Co. verbauten Mikrofone sind allerdings so gut, dass Siri hier nach wie vor anspringt.
In this work, we design a completely inaudible attack, DolphinAttack, that modulates voice commands on ultrasonic carriers (e.g., f > 20 kHz) to achieve inaudibility. By leveraging the nonlinearity of the microphone circuits, the modulated low- frequency audio commands can be successfully demodulated, recov- ered, and more importantly interpreted by the speech recognition systems. We validate DolphinAttack on popular speech recogni- tion systems, including Siri […]
Die Empfehlung der Forscher: Apple, Google und Co. sollten ihre Assistenz-Systeme so konfigurieren, dass Sprachbefehle die außerhalb der Sprachbanane liegen, standardmäßig ignoriert werden.