La inteligencia artificial (IA) y los avances en radares han dado un paso sorprendente (y algo inquietante) en el ámbito de la privacidad. Investigadores de la Universidad Estatal de Pensilvania desarrollaron una técnica llamada mmWave-Whisper que permite capturar y transcribir conversaciones telefónicas utilizando sensores de ondas milimétricas y modelos avanzados de IA.
Este innovador método combina sensores de alta precisión y modelos de IA para lograr lo que hasta hace poco era impensable: captar las diminutas vibraciones de un celular en el altavoz durante una llamada y convertirlas en texto. ¿Cómo lo hicieron?
- Sensores de ondas milimétricas: Los científicos emplearon un radar que funciona en el rango de los 77 a 81 GHz, capaz de detectar vibraciones de solo siete micrómetros. Estas ondas son capaces de captar vibraciones minúsculas en el teléfono sin importar el ruido de fondo.
- Modelos de IA: Una vez que el radar capta las vibraciones generadas por el altavoz del celular, un modelo de IA (adaptado a partir de Whisper, el modelo de transcripción de OpenAI) convierte estas señales en texto. Aunque la precisión no es del 100%, los resultados son sorprendentes, alcanzando una tasa de precisión del 50% en palabras y 67% en caracteres.
A diferencia de los métodos tradicionales de espionaje que dependen de un ambiente tranquilo para funcionar, esta técnica se mantiene efectiva incluso en entornos ruidosos. Esto significa que una conversación podría ser captada con relativa claridad, aunque la calidad de transcripción aún enfrenta desafíos.
Amenaza a la privacidad
La posibilidad de que un radar sin contacto directo pueda captar y transcribir una conversación telefónica plantea nuevos riesgos para la privacidad de los usuarios. Esta tecnología es capaz de comprometer la seguridad de cualquier conversación que se lleve a cabo cerca del dispositivo, lo que abre el camino para potenciales usos malintencionados en ámbitos donde se maneja información confidencial, desde temas financieros hasta datos corporativos.
Este desarrollo representa una evolución en el espionaje digital, superando en precisión a estudios anteriores que solo habían podido captar palabras limitadas y en condiciones controladas. Aquí, el sistema mmWave-Whisper demuestra que es posible captar un vocabulario más amplio y transcribir frases completas, lo que lo convierte en un avance significativo.
El desafío técnico: superar las barreras de ruido e interferencia
El equipo investigador, liderado por Suryoday Basak, enfrentó varios obstáculos para hacer viable el mmWave-Whisper. Las vibraciones que intentaban captar se acercaban al nivel de ruido base del sistema, lo que dificultaba su identificación. Además, el radar enfrentaba interferencias de osciladores de frecuencia y señales reflejadas, lo que generaba ruido en la señal capturada.
Para enfrentar estos retos, los investigadores usaron técnicas de corrección de errores y seguimiento de variaciones de fase en la señal de radar. Esto les permitió aislar con mayor precisión los micromovimientos de las vibraciones del teléfono y convertir estos movimientos en un flujo de audio, que luego fue transcrito. Aunque el audio resultante tiene una calidad imperfecta, es lo suficientemente claro como para capturar palabras y frases sueltas.
¿Qué información podría revelar este tipo de espionaje?
La capacidad de captar fragmentos de conversaciones, aunque sea de manera incompleta, es suficiente para comprometer la privacidad de cualquier usuario. Con mmWave-Whisper, el radar y la IA pueden captar información sensible, especialmente en situaciones donde se discuten datos personales o financieros.
A pesar de la baja precisión en comparación con otros modelos de transcripción más avanzados, la capacidad de captar palabras y frases aisladas puede ser utilizada para identificar información importante o para comprender el contexto de una conversación. Este tipo de riesgo se vuelve particularmente relevante en entornos corporativos o en contextos donde la confidencialidad es crucial.
El estudio de mmWave-Whisper marca un hito, ya que otros experimentos previos en detección de audio por radiofrecuencia se habían limitado a vocabularios reducidos o en condiciones mucho más controladas. Con este avance, se demuestra que es posible transcribir un conjunto completo de palabras, lo que amplía su potencial de uso en espionaje en diversas situaciones.
¿Qué tan cerca estamos de una amenaza real?
Aunque mmWave-Whisper todavía tiene limitaciones importantes —como la baja precisión y la distancia máxima de operación de poco más de un metro—, el simple hecho de que una tecnología así exista es una llamada de atención. Este sistema podría perfeccionarse con el tiempo, y en manos equivocadas, abrir la puerta a actividades maliciosas en entornos específicos.
La tecnología aún requiere de condiciones controladas para funcionar de manera óptima, pero, a medida que avance, es posible que el sistema de radares e IA mejore su capacidad de detección y transcripción, incluso en condiciones menos favorables.
Dicho esto, el desarrollo de mmWave-Whisper subraya la importancia de anticipar estas amenazas y de tomar medidas para proteger nuestros datos y nuestra información más personal.