Clau per emportar
- Els investigadors han ideat un mètode per codificar converses per evitar que els micròfons canalla capturen les nostres converses.
- El mètode és important, ja que funciona en temps real en streaming d'àudio i amb una formació mínima.
- Els experts aplaudeixen la investigació, però pensen que no serveix de gaire a l'usuari mitjà de telèfons intel·ligents.
Estem envoltats de dispositius intel·ligents amb micròfons, però què passa si s'han compromès a escoltar-nos?
En un esforç per protegir les nostres converses dels espiadors, els investigadors de la Universitat de Columbia han desenvolupat un mètode de camuflatge de veu neuronal que altera els sistemes de reconeixement automàtic de la veu en temps real sense molestar a la gent.
"Amb la invasió de [dispositius intel·ligents activats per veu] a les nostres vides, la idea de privadesa comença a evaporar-se a mesura que aquests dispositius d'escolta estan sempre encesos i supervisant el que es diu", Charles Everette, director de Cyber Advocacy, Deep Instinct, va dir a Lifewire per correu electrònic. "Aquesta investigació és una resposta directa a la necessitat d'amagar o camuflar la veu i les converses d'un individu d'aquests escoltes electrònics, coneguts o desconeguts en una zona."
Parlant
Els investigadors han desenvolupat un sistema que genera sons silenciosos que pots reproduir a qualsevol habitació per evitar que els micròfons canalla espiin les teves converses.
La manera com aquest tipus de tecnologia contraresta les escoltes recorda a Everette els auriculars amb cancel·lació de soroll. En lloc de generar sons silenciosos per cancel·lar el soroll de fons, els investigadors emeten sons de fons que pertorben els algorismes d'Intel·ligència Artificial (IA) que interpreten les ones sonores en àudio comprensible.
Aquests mecanismes per camuflar la veu d'una persona no són únics, però el que diferencia Neural Voice Camouflage dels altres mètodes és que funciona en temps real a l'audio en temps real.
"Per operar amb veu en directe, el nostre enfocament ha de predir [l'àudio de codificació correcte] en el futur perquè es puguin reproduir en temps real", assenyalen els investigadors al seu article. Actualment, el mètode funciona per a la majoria de la llengua anglesa.
Hans Hansen, director general de Brand3D, va dir a Lifewire que la investigació és molt important, ja que ataca una debilitat important dels sistemes d'IA actuals.
En una conversa per correu electrònic, Hansen va explicar que els sistemes actuals d'IA d'aprenentatge profund en general i el reconeixement natural de la parla en particular funcionen després de processar milions de registres de dades de parla recollits de milers de parlants. En canvi, Neural Voice Camouflage funciona després de condicionar-se a només dos segons de veu d'entrada.
Personalment, si em preocupen els dispositius que escolten, la meva solució no seria afegir un altre dispositiu d'escolta que intenti generar soroll de fons.
Arbre incorrecte?
Brian Chappell, estrateg en cap de seguretat de BeyondTrust, creu que la investigació és més beneficiosa per als usuaris empresarials que temen estar enmig de dispositius compromesos que escolten paraules clau que indiquen que s'està parlant informació valuosa..
"On aquesta tecnologia podria ser més interessant és en un estat de vigilància més autoritari on s'utilitza l'anàlisi d'impressió de veu i vídeo d'IA contra els ciutadans", va dir James Maude, investigador principal de seguretat cibernètica de BeyondTrust, a Lifewire per correu electrònic..
Maude va suggerir que una millor alternativa seria implementar controls de privadesa sobre com aquests dispositius capturen, emmagatzemen i utilitzen les dades. A més, Chappell creu que la utilitat del mètode de l'investigador és limitada, ja que no està dissenyat per aturar l'escolta humana.
"Per a la llar, tingueu en compte que, almenys en teoria, l'ús d'aquesta eina farà que Siri, Alexa, Google Home i qualsevol altre sistema que estigui activat amb una paraula activada parlada us ignori", va dir. Chappell.
Però els experts creuen que amb la creixent inclusió de tecnologia específica d'IA/ML als nostres dispositius intel·ligents, és totalment possible que aquesta tecnologia acabi dins dels nostres telèfons, en un futur proper.
Maude està preocupada perquè les tecnologies d'IA poden aprendre ràpidament a diferenciar entre el soroll i l'àudio real. Creu que, tot i que inicialment el sistema podria tenir èxit, podria convertir-se ràpidament en un joc de gat i ratolí a mesura que un dispositiu d'escolta aprengui a filtrar els sorolls d'embussos.
El que és més preocupant, Maude va assenyalar que qualsevol que l'utilitzi podria, de fet, cridar l'atenció sobre si mateix, ja que interrompre el reconeixement de veu semblaria inusual i podria indicar que estàs intentant amagar alguna cosa.
"Personalment, si em preocupen els dispositius que escolten, la meva solució no seria afegir un altre dispositiu d'escolta que busqui generar soroll de fons", va compartir Maude. "Sobretot perquè només augmenta el risc que un dispositiu o una aplicació sigui piratejat i pugui escoltar-me."