14 Feb 2026 · Original en inglés · Resumen IA

Medios restringen acceso a Internet Archive por IA

Fuentes: News publishers limit Internet Archive access due to AI scraping concerns

Varios medios de comunicación, comenzando con The Guardian, están limitando el acceso del Internet Archive a su contenido en línea debido a preocupaciones sobre el uso de la información para entrenar modelos de inteligencia artificial (IA). El Internet Archive, conocido por su Wayback Machine que archiva páginas web, se ha convertido en una fuente atractiva para empresas de IA que buscan datos para alimentar sus modelos. The Guardian ha bloqueado el acceso de la IA a sus artículos a través de las APIs del Internet Archive y la interfaz Wayback Machine, permitiendo únicamente el acceso a páginas de inicio y temas. Otros medios, como The New York Times y The Financial Times, están tomando medidas similares, bloqueando bots de IA como los de OpenAI y Anthropic. Reddit también ha restringido el acceso del Internet Archive a su plataforma. Si bien el Internet Archive defiende su misión de democratizar la información, la creciente preocupación por la extracción de contenido para IA está llevando a los editores a reevaluar su relación con la organización. El fundador del Internet Archive, Brewster Kahle, advierte que estas restricciones podrían limitar el acceso público al registro histórico y afectar su capacidad para combatir la desinformación.

Temas

ia empresas

Etiquetas

internet archive wayback machine the guardian openai inteligencia artificial brewster kahle the new york times the financial times reddit ia scraping

Entidades mencionadas

LLMs software

Financial Times organization

Financial Times (FT) es un periódico de origen británico con especial énfasis en noticias internacionales de negocios y economía. El periódico, publicado por Pearson PLC en Londres, fue fundado en 188

Ver en Wikipedia

Perplexity organization

Perplexity, también denominado Perplexity AI, es un motor de búsqueda conversacional, comercializado como un «motor de respuestas», que responde consultas utilizando texto predictivo en lenguaje natur

Ver en Wikipedia

Mastodon software

Wayback Machine software

The Guardian organization

The Guardian es un diario británico. Se le conoció desde 1821 hasta 1959 como el Manchester Guardian. Junto con sus periódicos hermanos The Observer y The Guardian Weekly, The Guardian es parte del Gu

Ver en Wikipedia

Internet Archive’s APIs software

Robert Hahn person

Robert M. "Bob" Hahn fue un jugador de baloncesto estadounidense que disputó una temporada en la NBA. Con 2,08 metros de estatura, jugaba en la posición de pívot.

Ver en Wikipedia

Matt Rogerson person

Matt Rogers es un comediante, actor, guionista, podcaster y presentador de televisión estadounidense. Es conocido principalmente por conducir el pódcast Las Culturistas junto a Bowen Yang desde 2016.

Ver en Wikipedia

Michael Nelson person

Michael Wilson fue un guionista estadounidense.

Ver en Wikipedia

Old Dominion University organization

La Universidad de Old Dominion es una universidad pública ubicada en Norfolk, Virginia. Su nombre se debe a que Old Dominion era la denominación que recibía el territorio de Virginia, por decisión de

Ver en Wikipedia

Brewster Kahle person

Brewster Lurton Kahle es un ingeniero informático, emprendedor y activista de internet. Es un defensor del acceso universal al conocimiento y a la biblioteca digital. Fue el creador, en 1996, de Inter

Ver en Wikipedia

Nieman Lab person

Niermala Badrising es una diplomática y política surinamesa. Fue Ministra de Relaciones Exteriores de Surinam en el gabinete del presidente Dési Bouterse, entre el 12 de agosto de 2015 y el 1 de febre

Ver en Wikipedia

Anthropic organization

Anthropic es una empresa emergente estadounidense de investigación y desarrollo de inteligencia artificial (IA) fundada por exmiembros de OpenAI.

Ver en Wikipedia

The New York Times organization

The New York Times es un periódico publicado en la ciudad de Nueva York y cuyo editor es Arthur Sulzberger que se distribuye en los Estados Unidos y otros países.

Ver en Wikipedia

Reddit organization

Reddit es un sitio web de marcadores sociales y agregador de noticias donde los usuarios pueden añadir textos, imágenes, videos o enlaces. Los usuarios pueden votar a favor o en contra del contenido,

Ver en Wikipedia

Google organization

Google LLC es una empresa de tecnología multinacional con sede en California, Estados Unidos, que se centra en inteligencia artificial, publicidad en línea, tecnología de motores de búsqueda, computac

Ver en Wikipedia

OpenAI organization

OpenAI, LLC es una empresa estadounidense de investigación y despliegue de inteligencia artificial fundada en 2015 e, inicialmente, sin ánimo de lucro. Su misión original era asegurar que la inteligen

Ver en Wikipedia

The Verge organization

The Verge es un sitio web de noticias de tecnología estadounidense con oficinas en Manhattan, Nueva York y operado por Vox Media. La red divulga noticias, reseñas de productos y podcasts.

Ver en Wikipedia

Cloudflare organization

Cloudflare, Inc. es una empresa estadounidense que proporciona una red de entrega de contenido, servicios de seguridad de Internet y servicios de servidores de nombres de dominio distribuidos, localiz

Ver en Wikipedia

Internet Archive organization

Internet Archive es una biblioteca digital estadounidense sin fines de lucro fundada en 1996 por Brewster Kahle. Ofrece acceso gratuito a colecciones de materiales digitalizados, incluidos sitios web,

Ver en Wikipedia