Miasma: herramienta anti-scraping para sitios web

Fuentes: Herramienta Miasma ayuda a los sitios web a combatir el scraping de datos de IA

Un desarrollador ha lanzado "Miasma", una herramienta de código abierto diseñada para ayudar a los sitios web a defenderse del scraping de datos por parte de empresas de inteligencia artificial. Miasma actúa como una trampa, redirigiendo el tráfico malicioso a un servidor que inyecta datos de entrenamiento envenenados y enlaces autoreferenciales, confundiendo a los modelos de IA que intentan extraer información. La herramienta es de rápido despliegue y bajo consumo de recursos, y se configura a través de Nginx para redirigir el tráfico sospechoso a una ruta específica (ej: /naughty-bots). Los usuarios deben configurar cuidadosamente sus robots.txt para evitar afectar a los motores de búsqueda legítimos. El autor advierte sobre los riesgos inherentes al uso de la herramienta y la posibilidad de represalias por parte de los operadores de los scrapers, enfatizando la responsabilidad del usuario en el cumplimiento de las leyes y políticas de alojamiento. Miasma no está afiliada a la fuente de datos envenenados que utiliza y no garantiza la seguridad de su contenido.