Médias vs IA : la guerre des archives web

4 min de lecture · Siecle Digital · Jennifer Larcher · 5 mai 2026 IA générative 8/10 Élevé

Des centaines de médias bloquent leurs archives pour empêcher leur utilisation par les modèles d'IA, menaçant la Wayback Machine. L'Internet Archive, qui stocke plus de mille milliards de pages web depuis 1996, est pris entre deux feux.

« Le mécanisme consiste à bloquer l’archiviste pour atteindre le pilleur » — Siecle Digital

Que faut-il retenir ?

L'Internet Archive stocke plus de mille milliards de pages web depuis 1996.
241 sites d’information dans le monde entier bloquent au moins l’un des quatre robots d’exploration de l’Archive.
Une vingtaine de médias ont ciblé nommément ia_archiverbot pour lui couper l’accès.
L’Archive a pris des mesures comme des restrictions sur les téléchargements massifs.

Pourquoi cette nouvelle compte-t-elle ?

Les médias bloquent leurs archives pour protéger leurs droits d'auteur face aux modèles d'IA, mais cela menace la préservation historique. Les entreprises d'IA trouveront d'autres sources, mais les historiens n'ont pas de plan B. Cela soulève des questions sur l'équilibre entre droits d'auteur et accès à l'information.

Plus de mille milliards de pages web stockées depuis 1996

💬 Mark Graham, Directeur de la Wayback Machine

Public concerné : entreprises

Pourquoi les médias bloquent-ils leurs archives web ?

Les médias bloquent leurs archives pour empêcher leur utilisation par les modèles d'IA sans permission, protégeant ainsi leurs droits d'auteur mais menaçant la préservation historique.

Voir l'article original →

← Retour aux actualités

Accueil

Outils

Annuaire

Apprendre