Médias vs IA : la guerre des archives web
Des centaines de médias bloquent leurs archives pour empêcher leur utilisation par les modèles d'IA, menaçant la Wayback Machine. L'Internet Archive, qui stocke plus de mille milliards de pages web depuis 1996, est pris entre deux feux.
« Le mécanisme consiste à bloquer l’archiviste pour atteindre le pilleur » — Siecle Digital
Que faut-il retenir ?
- L'Internet Archive stocke plus de mille milliards de pages web depuis 1996.
- 241 sites d’information dans le monde entier bloquent au moins l’un des quatre robots d’exploration de l’Archive.
- Une vingtaine de médias ont ciblé nommément ia_archiverbot pour lui couper l’accès.
- L’Archive a pris des mesures comme des restrictions sur les téléchargements massifs.
Pourquoi cette nouvelle compte-t-elle ?
Les médias bloquent leurs archives pour protéger leurs droits d'auteur face aux modèles d'IA, mais cela menace la préservation historique. Les entreprises d'IA trouveront d'autres sources, mais les historiens n'ont pas de plan B. Cela soulève des questions sur l'équilibre entre droits d'auteur et accès à l'information.
Plus de mille milliards de pages web stockées depuis 1996
💬 Mark Graham, Directeur de la Wayback Machine
Public concerné : entreprises
Pourquoi les médias bloquent-ils leurs archives web ?
Les médias bloquent leurs archives pour empêcher leur utilisation par les modèles d'IA sans permission, protégeant ainsi leurs droits d'auteur mais menaçant la préservation historique.
Commentaires (0)
💡 Aucun lien externe ni code HTML accepté. Soyez respectueux. Les commentaires sont modérés avant publication.
Aucun commentaire pour le moment. Soyez le premier !