Medios restringen acceso a Internet Archive por IA

Fuentes: News publishers limit Internet Archive access due to AI scraping concerns

Varios medios de comunicación, comenzando con The Guardian, están limitando el acceso del Internet Archive a su contenido en línea debido a preocupaciones sobre el uso de la información para entrenar modelos de inteligencia artificial (IA). El Internet Archive, conocido por su Wayback Machine que archiva páginas web, se ha convertido en una fuente atractiva para empresas de IA que buscan datos para alimentar sus modelos. The Guardian ha bloqueado el acceso de la IA a sus artículos a través de las APIs del Internet Archive y la interfaz Wayback Machine, permitiendo únicamente el acceso a páginas de inicio y temas. Otros medios, como The New York Times y The Financial Times, están tomando medidas similares, bloqueando bots de IA como los de OpenAI y Anthropic. Reddit también ha restringido el acceso del Internet Archive a su plataforma. Si bien el Internet Archive defiende su misión de democratizar la información, la creciente preocupación por la extracción de contenido para IA está llevando a los editores a reevaluar su relación con la organización. El fundador del Internet Archive, Brewster Kahle, advierte que estas restricciones podrían limitar el acceso público al registro histórico y afectar su capacidad para combatir la desinformación.