Key Takeaways
- Eine wachsende Zahl von Programmen kann Ihre Sprache verstehen.
- Neue Technologie erzeugt benutzerdefinierte Audiogeräusche im Hintergrund, während Sie sprechen, um die Software zu verwirren, die zuhören könnte.
-
Die neue Technik erreicht Echtzeitleistung, indem sie einen Angriff auf die Zukunft des Signals oder Wortes vorhersagt.
Viele Programme können Ihre Sprache während Telefon- oder Videoanrufen verstehen, und Experten sagen, dass sie eine Gefahr für die Privatsphäre darstellen können.
Eine neue Technologie namens Neural Voice Camouflage, die von Forschern der Columbia University entwickelt wurde, könnte einen Schutz bieten. Es erzeugt beim Sprechen benutzerdefinierte Audiogeräusche im Hintergrund und verwirrt die künstliche Intelligenz (KI), die zuhört und Stimmen transkribiert.
„Das Vorhandensein von KI-Transkription wirft Vertrauensfragen auf“, Michael Huth, Mitbegründer von Xayn, einer Suchmaschine zum Schutz der Privatsphäre, und Leiter des Department of Computing am Imperial College London, der nicht beteiligt war die Forschung, sagte Lifewire in einem E-Mail-Interview. „Meeting-Teilnehmer sind vielleicht vorsichtiger, welche Punkte sie ansprechen und wie ihre Rede transkribiert wird. Das kann eine gute Sache sein, da es das respektvolle Verh alten verbessern kann, aber es kann auch eine schlechte Sache sein, da das Gespräch dadurch möglicherweise weniger offen ist Vorbeh alte gegenüber der verwendeten Technologie."
Zuhören und Lernen
Die Columbia-Forscher arbeiteten an der Entwicklung eines Algorithmus, der neuronale Netze in Echtzeit brechen könnte. Der neue Ansatz verwendet „prädiktive Angriffe“– ein Signal, das jedes Wort stören kann, für dessen Transkription automatische Spracherkennungsmodelle trainiert werden. Wenn Angriffsgeräusche drahtlos abgespielt werden, müssen sie außerdem laut genug sein, um jedes möglicherweise weit entfernte „Mithörmikrofon“zu stören.
"Eine zentrale technische Herausforderung, um dies zu erreichen, bestand darin, alles schnell genug zum Laufen zu bringen", sagte Carl Vondrick, Professor für Informatik an der Columbia University und einer der Autoren einer Studie, die den neuen Ansatz beschreibt, in einer Nachricht Veröffentlichung. "Unser Algorithmus, der es schafft, ein unbefugtes Mikrofon in 80 % der Fälle daran zu hindern, Ihre Worte richtig zu verstehen, ist der schnellste und genaueste auf unserem Testbed."
Die neue Technik erreicht eine Echtzeitleistung, indem sie einen Angriff auf die Zukunft des Signals oder Wortes vorhersagt. Das Team optimierte den Angriff, sodass er eine ähnliche Lautstärke wie normale Hintergrundgeräusche hat, sodass sich die Menschen in einem Raum natürlich unterh alten können, ohne erfolgreich von einem automatischen Spracherkennungssystem überwacht zu werden.
Meeting-Teilnehmer achten möglicherweise besser darauf, welche Punkte sie ansprechen und wie ihre Rede transkribiert wird.
Die Wissenschaftler sagten, dass ihre Technik auch dann funktioniert, wenn Sie nichts über das abtrünnige Mikrofon wissen, wie zum Beispiel seinen Standort oder sogar die Computersoftware, die darauf läuft. Es tarnt die Stimme einer Person Over-the-Air, verbirgt sie vor diesen Abhörsystemen und ohne die Konversation zwischen den Personen im Raum zu stören.
"Bisher funktioniert unsere Methode für den Großteil des englischsprachigen Vokabulars, und wir planen, den Algorithmus auf weitere Sprachen anzuwenden und schließlich das Flüstern völlig unhörbar zu machen", Mia Chiquier, die Hauptautorin der Studie und ein Doktorand in Vondricks Labor, sagte in der Pressemitteilung.
Gespräche privat h alten
Als ob das alles noch nicht genug wäre, könnte Werbung Sie auch auf der Grundlage von Audiodaten ansprechen, die von Ihrem Smartphone oder Ihren Smart-Home-Geräten gesammelt wurden.
"Mit Geräten wie [dem Amazon Echo] und seinen Gegenstücken sind diese Geräte nicht nur immer in Ihrem Zuhause und hören ständig alles, was Sie sagen oder tun, sondern sie - durch jahrelange Datenerfassung von ihren Benutzern - haben perfektionierte Verarbeitung natürlicher Sprache (Umwandlung von gesprochenem Wort in Text/nutzbare Daten für Geräte über eine Kombination aus Mikrofonen, Software und KI), sagte Erik Haig, ein Mitarbeiter bei Harbor Research, einem Strategieberatungs- und Venture-Entwicklungsunternehmen, in einer E-Mail.
KI-Transkriptionen von Konversationssprache sind heute ein Standardbestandteil kommerzieller Standardsoftware, sagte Huth. Beispielsweise verfügt Microsoft Teams über eine Option zum Aufzeichnen von Besprechungen mit integrierten KI-Transkriptionen, die von allen Teilnehmern in Echtzeit angezeigt werden können. Das vollständige Protokoll kann als Protokoll der Sitzung dienen. Normalerweise ermöglichen solche Transkripte eine Protokollierung (auch bekannt als Notizen), bei der das Protokoll beim nächsten Meeting genehmigt wird.
"Menschen könnten besorgt sein, ausspioniert zu werden, wenn die KI-Transkription aktiviert ist", fügte Huth hinzu."Dies scheint der Sorge sehr ähnlich zu sein, dass ein Gespräch ohne Zustimmung oder heimlich aufgezeichnet wird."
Aber nicht alle sind sich einig, dass intelligente Geräte eine Bedrohung darstellen. Die meisten Menschen müssen sich keine Sorgen darüber machen, dass Programme Ihre Gespräche abhören, sagte Brad Hong, ein Kundenerfolgsleiter bei der Cybersicherheitsfirma Horizon3, Lifewire per E-Mail. Er sagte, die wichtigste Sorge sei jetzt nicht, wer Sie aufzeichnet, sondern wie die Daten gespeichert werden.
"All die Geschichten, die man hört, dass ein Mikrofon auf seinem Computer oder mobilen Geräten aktiviert wird, Alexa oder Google Home mithören oder sogar eine staatliche Überwachung, es ist wahr, dass all dies dem Laien den Magen umdreht", fügte Hong hinzu. „Aber insgesamt sind die Menschen selten in einer Situation, die eine Tarnung ihrer Stimme erfordert.“