18 May 2026 · Original en inglés · Resumen IA

Investigadores chinos descubren falla que permite secuestrar IA de audio con sonidos ocultos

Fuentes: Hidden Voice Glitches Could Hijack Audio AI Tools

Investigadores de la Universidad de Zhejiang, China, han descubierto una vulnerabilidad crítica en modelos de inteligencia artificial de audio que permite hijackear estos sistemas mediante sonidos imperceptibles embedidos en clips de audio. La investigación, que se presentará la próxima semana en el IEEE Symposium on Security and Privacy en San Francisco, revela que un audio modificado indetectable por el oído humano puede manipular el comportamiento de estos modelos con una tasa de éxito del 79 al 96 por ciento. Los investigadores probaron la técnica, denominada AudioHijack, contra 13 modelos de código abierto líderes, incluyendo servicios comerciales de Microsoft y Mistral, logrando que los modelos realizaran búsquedas web sensibles, descargaran archivos de fuentes controladas por atacantes y enviaran correos electrónicos con datos de usuarios. El líder del estudio, Meng Chen, estudiante de doctorado, explicó que solo se necesita media hora para entrenar esta señal y que, al ser independiente del contexto, puede utilizarse para atacar el modelo cuando se desee, sin importar las instrucciones que proporcione el usuario. La técnica explota una falla de seguridad crítica en el diseño de grandes modelos audio-lenguaje: al recibir instrucciones en formato de audio, instrucciones maliciosas pueden ocultarse en clips manipulados para elicitar comportamientos no deseadas. Microsoft respondió que valora el trabajo de los investigadores para avanzar en la comprensión de este tipo de técnicas.

Temas

ia empresas

Etiquetas

inteligencia artificial seguridad cibernética audio ia microsoft mistral zhengjiang university meng chen audiohijack modelosgenerativosia vulnerabilidadesia

Entidades mencionadas

Microsoft organization

Microsoft Corporation es una empresa tecnológica multinacional con sede en Redmond (Washington), Estados Unidos. Los productos de software más conocidos de la firma son la línea de sistemas operativos

Ver en Wikipedia

Mistral person

Lucila de María Godoy Alcayaga, conocida como Gabriela Mistral, fue una poeta, diplomática, profesora y pedagoga chilena.

Ver en Wikipedia

Meng Chen location

Mengcheng es un condado bajo la administración directa de la Prefectura Bozhou en la Provincia de Anhui, República Popular China. Su área es de 2143 km² y su población total para 2020 superó el milló

Ver en Wikipedia

Zhejiang University organization

La Universidad de Zhejiang es una universidad nacional de China. Fundada en 1897, la Universidad de Zhejiang es una de las instituciones de educación superior más antiguas y prestigiosas de China. Es

Ver en Wikipedia

China location

China es el país donde se fabrican algunas versiones del tubo J305, y la noticia destaca variaciones dimensionales en estos tubos chinos que pueden afectar la compatibilidad con la placa GGreg20_V3.

Ver en Wikipedia

IEEE Symposium on Security and Privacy event

San Francisco location

San Francisco, de forma oficial Ciudad y Condado de San Francisco, es una ciudad que ocupa la cuarta posición de ciudad más poblada del estado de California y la 17.ª de Estados Unidos, con una poblac

Ver en Wikipedia

audio software

speech recognition software

classification software

digital audio software

optimization algorithm software

generative AI software

AI models software

Zoom organization

Zoom es un programa de software de videochat desarrollado por Zoom Video Communications. El plan gratuito ofrece un servicio de video chat que permite hasta 100 participantes al mismo tiempo, con una

Ver en Wikipedia

Enlaces

https://arxiv.org/abs/2604.14604v1 arxiv.org

Meng Chen www.researchgate.net

developed previously dl.acm.org