IA: Agentes secretos conversan ocultando sus mensajes

Fuentes: Undetectable Conversations Between AI Agents via Pseudorandom Noise-Resilient Key Exchange

La creciente adopción de agentes de inteligencia artificial (IA) que interactúan entre sí plantea nuevas preocupaciones sobre la seguridad y la privacidad. Este artículo de investigación explora la posibilidad de que dos agentes de IA, controlados por entidades diferentes, puedan mantener una conversación secreta simultáneamente mientras generan una transcripción que parezca una interacción honesta, incluso para un observador externo sofisticado. En esencia, se trata de lograr una comunicación encubierta entre IA.

El trabajo se basa en técnicas existentes de marcas de agua (watermarking) y esteganografía aplicadas a modelos de lenguaje grandes (LLMs). Inicialmente, asume que los agentes comparten una clave secreta única para cada interacción. Con esta clave, pueden transmitir mensajes ocultos aprovechando casi toda la información contenida en los mensajes aparentemente honestos. Esto significa que la conversación secreta puede ser muy eficiente, maximizando la cantidad de información transmitida de forma encubierta.

La contribución más significativa del artículo es extender esta capacidad a un escenario 'sin clave', donde los agentes no comparten información secreta inicial. Sorprendentemente, los investigadores demuestran que la comunicación encubierta es posible incluso cuando los modelos de IA tienen contextos privados, los mensajes son cortos y adaptativos, y solo se requiere que un número suficiente de mensajes individuales tengan una cantidad mínima de entropía (una medida de impredecibilidad). Esto contrasta con enfoques anteriores que requerían una entropía mínima muy alta en cada mensaje individual.

Para lograr esto, los autores introducen una nueva técnica criptográfica llamada 'intercambio de clave resistente al ruido pseudorandom'. Este protocolo permite a los agentes establecer una clave secreta a través de una transcripción pública que parece ruido aleatorio, pero que aún es correcta incluso con la presencia de 'ruido' (interferencia). El artículo analiza a fondo esta técnica, presentando diferentes construcciones y demostrando que los enfoques más simples son vulnerables a ataques.

¿Para qué sirve esto? Imagina dos empresas que necesitan coordinar acciones de forma discreta, sin que un tercero pueda detectar la colaboración. O, considera un escenario donde un agente de IA necesita comunicarse con otro para evitar la detección por parte de un adversario. Este trabajo abre la puerta a estas posibilidades, aunque con importantes limitaciones.

Consideraciones importantes: La investigación destaca que la simple auditoría de las transcripciones de las interacciones de IA no es suficiente para descartar la coordinación encubierta. Además, la técnica introduce una nueva área de investigación criptográfica con implicaciones más amplias. Sin embargo, es crucial entender que la seguridad de estas comunicaciones encubiertas depende de varios factores, incluyendo la cantidad de entropía en los mensajes y la robustez del protocolo de intercambio de clave. Existen alternativas, como el uso de canales de comunicación seguros tradicionales, pero estas pueden ser más fáciles de detectar o menos eficientes.