El hacker de Anthropic que advierte al Gobierno sobre los riesgos de su propia IA

Fuentes: The Hacker Sent by Anthropic to Calm the Government’s Nerves About AI Safety

Nicholas Carlini, investigador de ciberseguridad de Anthropic conocido como el «escéptico profesional» del sector, ha cambiado su postura sobre la seguridad de los modelos de inteligencia artificial de la compañía y ahora alerta de su potencial destructivo. En marzo, ante unos 700 expertos en ciberseguridad reunidos en un edificio histórico de San Francisco, Carlini demostró cómo utilizó el modelo de nueva generación Mythos, desarrollado por Anthropic, para localizar y explotar una vulnerabilidad crítica en el software de publicación web Ghost y otra en el sistema operativo Linux, una de las piezas de software más testeadas del mundo y base de miles de millones de dispositivos.

La advertencia de Carlini contrasta con la creciente preocupación que, según el artículo, se ha instalado en la Administración Trump en los últimos días ante la capacidad de la próxima generación de software de Anthropic para causar estragos en la ciberseguridad global. La demostración de marzo adelantó en semanas un debate que ahora ha alcanzado la esfera política en Washington. Carlini, de 35 años, goza de un amplio reconocimiento en la comunidad de hackers y su cambio de opinión otorga peso técnico a los avisos sobre los riesgos de los modelos avanzados de IA.