Una vulnerabilidad crítica en el sistema de soporte de Instagram, basado en inteligencia artificial, permitió a atacantes tomar el control de cuentas de usuarios —incluidas varias de alto perfil— simplemente engañando al propio chatbot de asistencia de Meta. El problema, que estuvo activo durante semanas o incluso meses según investigadores, fue finalmente corregido por la compañía, aunque persisten las dudas sobre la magnitud real del incidente.
El método de ataque, descrito en detalle por el investigador de seguridad conocido como 0xsid en su blog personal y verificado de forma independiente por TechCrunch, se basa en un flujo de recuperación de contraseña que carece prácticamente de cualquier barrera de autenticación. Para iniciar el proceso, el atacante solo necesita el nombre de usuario de la víctima. A continuación, utiliza una VPN o proxy para simular que la solicitud proviene de la misma región geográfica del objetivo, evitando así los sistemas automatizados de detección de Instagram. Una vez dentro del chat con el asistente de IA de soporte de Meta, el atacante afirma que la cuenta fue hackeada y solicita que los códigos de verificación se envíen a una dirección de correo electrónico arbitraria bajo su control.
Lo que resulta especialmente alarmante, según 0xsid, es que el sistema no realiza ninguna verificación adicional sobre si el correo electrónico proporcionado ha sido utilizado previamente por el usuario legítimo. El chatbot envía el código al correo del atacante, quien lo devuelve al sistema para completar la verificación, tras lo cual la plataforma entrega un enlace de restablecimiento de contraseña que otorga el control total de la cuenta. En algunos casos, la IA de Instagram puede solicitar un selfie en video para verificar la identidad, pero esta medida resulta insuficiente: según el investigador, basta con una foto pública del objetivo animada mediante herramientas de inteligencia artificial para superar el control.
La gravedad del fallo se amplifica por el hecho de que la autenticación de dos factores (2FA) queda completamente inutilizada. El sistema trata este flujo de recuperación de alta privilegios como un restablecimiento total de cuenta por el verdadero propietario, por lo que el 2FA original se omite por completo en el proceso. Las sesiones existentes se revocan y la contraseña se cambia sin enviar notificaciones por correo, mensaje de texto o push al dueño legítimo. Una vez completado el ataque, la víctima no puede iniciar un proceso de recuperación porque tanto el correo como los números de teléfono asociados quedan vinculados al atacante.
Las primeras señales del problema surgieron durante el fin de semana, cuando numerosos usuarios de Reddit y X comenzaron a reportar la compromisión de sus cuentas, según documentó TechCrunch. Entre las cuentas afectadas se encuentran la del investigador de seguridad Jane Wong —quien describió cómo la contraseña fue cambiada sin su conocimiento y recibió múltiples intentos de restablecimiento a lo largo del día—, el handle oficial de la Casa Blanca de la era Obama (inactivo desde 2017) y la del sargento mayor jefe de la Fuerza Espacial de Estados Unidos, John Bentivegna. Un video publicado en X mostró paso a paso el procedimiento del ataque, incluyendo el momento en que el chatbot de Meta envía el código de verificación al correo del atacante, hecho que TechCrunch pudo verificar de forma independiente.
El investigador 0xsid señala que, durante el tiempo que la vulnerabilidad estuvo activa, proliferaron en Telegram múltiples grupos de mercados negros que ofrecían servicios de toma de cuentas con tarifas elevadas y plazos de entrega rápidos. Considerando que los nombres de usuario cortos valen cientos de miles o incluso millones de dólares, no es una sorpresa, escribió. Algunas cuentas fueron revendidas, mientras que otras, como la de la Casa Blanca o la del sargento mayor de la Fuerza Espacial, fueron utilizadas para difundir propaganda.
Este episodio plantea interrogantes profundas sobre el papel de la inteligencia artificial en procesos críticos de seguridad. Que un chatbot destinado a asistir a usuarios pueda ser manipulado con una simple petición textual para entregar el control de cuentas revela un nivel de falta de barreras de protección que resulta aterrador, si no fuera tan absurdo, en palabras del propio investigador. El incidente ilustra cómo la automatización de funciones sensibles, sin supervisión humana ni capas adicionales de verificación, puede convertirse en un vector de ataque en sí misma.
El lunes, Andy Stone, portavoz de Instagram, confirmó a través de su cuenta en X que el problema había sido corregido, aunque no ofreció detalles sobre el número de cuentas afectadas ni sobre la duración exacta de la vulnerabilidad. Por su parte, Meta no respondió a la solicitud de comentarios de TechCrunch. Según 0xsid, el método estuvo operativo durante semanas, si no meses, y los grupos de Telegram especializados en estos servicios han reducido su actividad desde que la compañía implementó la solución. Por ahora, los usuarios cuyas cuentas formen parte del grupo A/B en el que la opción de soporte mediante IA está activa no pueden desactivarla. El caso deja una lección incómoda para la industria: integrar modelos de lenguaje en flujos de seguridad sin las salvaguardas adecuadas puede convertir una herramienta de protección en la vulnerabilidad más explotable del sistema.
