07 Apr 2026 · Original en inglés · Artículo

IA: Agentes secretos conversan ocultando sus mensajes

Fuentes: Undetectable Conversations Between AI Agents via Pseudorandom Noise-Resilient Key Exchange

La creciente adopción de agentes de inteligencia artificial (IA) que interactúan entre sí plantea nuevas preocupaciones sobre la seguridad y la privacidad. Este artículo de investigación explora la posibilidad de que dos agentes de IA, controlados por entidades diferentes, puedan mantener una conversación secreta simultáneamente mientras generan una transcripción que parezca una interacción honesta, incluso para un observador externo sofisticado. En esencia, se trata de lograr una comunicación encubierta entre IA.

El trabajo se basa en técnicas existentes de marcas de agua (watermarking) y esteganografía aplicadas a modelos de lenguaje grandes (LLMs). Inicialmente, asume que los agentes comparten una clave secreta única para cada interacción. Con esta clave, pueden transmitir mensajes ocultos aprovechando casi toda la información contenida en los mensajes aparentemente honestos. Esto significa que la conversación secreta puede ser muy eficiente, maximizando la cantidad de información transmitida de forma encubierta.

La contribución más significativa del artículo es extender esta capacidad a un escenario 'sin clave', donde los agentes no comparten información secreta inicial. Sorprendentemente, los investigadores demuestran que la comunicación encubierta es posible incluso cuando los modelos de IA tienen contextos privados, los mensajes son cortos y adaptativos, y solo se requiere que un número suficiente de mensajes individuales tengan una cantidad mínima de entropía (una medida de impredecibilidad). Esto contrasta con enfoques anteriores que requerían una entropía mínima muy alta en cada mensaje individual.

Para lograr esto, los autores introducen una nueva técnica criptográfica llamada 'intercambio de clave resistente al ruido pseudorandom'. Este protocolo permite a los agentes establecer una clave secreta a través de una transcripción pública que parece ruido aleatorio, pero que aún es correcta incluso con la presencia de 'ruido' (interferencia). El artículo analiza a fondo esta técnica, presentando diferentes construcciones y demostrando que los enfoques más simples son vulnerables a ataques.

¿Para qué sirve esto? Imagina dos empresas que necesitan coordinar acciones de forma discreta, sin que un tercero pueda detectar la colaboración. O, considera un escenario donde un agente de IA necesita comunicarse con otro para evitar la detección por parte de un adversario. Este trabajo abre la puerta a estas posibilidades, aunque con importantes limitaciones.

Consideraciones importantes: La investigación destaca que la simple auditoría de las transcripciones de las interacciones de IA no es suficiente para descartar la coordinación encubierta. Además, la técnica introduce una nueva área de investigación criptográfica con implicaciones más amplias. Sin embargo, es crucial entender que la seguridad de estas comunicaciones encubiertas depende de varios factores, incluyendo la cantidad de entropía en los mensajes y la robustez del protocolo de intercambio de clave. Existen alternativas, como el uso de canales de comunicación seguros tradicionales, pero estas pueden ser más fáciles de detectar o menos eficientes.

Temas

Etiquetas

inteligencia artificial criptografía seguridad informática modelos de lenguaje esteganografía comunicación encubierta agentes de ia privacidad de datos intercambio de claves pseudorandom

Entidades mencionadas

cryptography software

AI Agents software

arXiv organization

arXiv es un archivo en línea para las prepublicaciones de artículos científicos en el campo de las matemáticas, física, ciencias de la computación y biología cuantitativa. En muchos campos de las mate

Ver en Wikipedia

Hugging Face organization

LLMs software

Llissá de Vall es un municipio de la comarca del Vallés Oriental situado en la Vall del Tenes y el límite de la llanura de Granollers.