Cómo proteger el arte en línea del entrenamiento de modelos de IA

Fuentes: How to protect artwork online from LLM and diffusion model trainingT3

Un artista plantea en un foro cómo evitar que sus obras se usen para entrenar modelos de IA generativa, ya sean modelos de difusión o grandes modelos de lenguaje. La conversación reúne varias estrategias complementarias con sus ventajas y limitaciones reales.

La opción más sencilla es no publicar la obra en abierto: cualquier obra accesible, aunque sea temporalmente, puede ser recopilada por rastreadores o por terceros. Si se desea mantener una presencia pública, se mencionan dos mecanismos: un muro de registro o inicio de sesión que limite el acceso a personas reales, y el despliegue de defensas contra rastreadores como Iocaine, una herramienta que bloquea buena parte de los bots de scraping sin dificultar la navegación de visitantes legítimos. También se recomienda evitar la indexación en buscadores comerciales, ya que estos alimentan sus propios modelos con el contenido que indexan.

Sobre las técnicas de "envenenamiento" como Glaze y Nightshade, los participantes señalan limitaciones importantes: su eficacia varía según el modelo, las licencias asociadas son problemáticas y no existe garantía de protección a largo plazo. Algunos defienden que compartir la obra es esencial para que llegue a ojos humanos y asumen el riesgo de que también la vea una máquina. Otros subrayan que ningún DRM actual puede rastrear la procedencia de los datos dentro de los modelos de IA. En resumen, no existe una solución mágica: lo más eficaz hoy es combinar muros de acceso, bloqueo de rastreadores y renuncia a la indexación pública, aceptando que el riesgo cero no es posible.