
Image by Bernard Goldbach, from Flickr
Les Archivistes Numériques Travaillent pour Sauver les Données Publiques de la Disparition
Depuis plus de 30 ans, la Wayback Machine de l’Internet Archive a préservé les sites Web et les ensembles de données gouvernementaux essentiels pour la recherche, comme le détaille un nouveau rapport par Spectrum.
Pressée ? Voici les faits en bref :
- La Machine Wayback conserve des données gouvernementales essentielles qui servent de matériel vital pour la recherche en science et en ingénierie.
- Pendant le second mandat présidentiel de Trump, plus de 8 000 pages web et bases de données gouvernementales ont disparu de l’accès public.
- Le Library Innovation Lab de l’Université Harvard a réussi à préserver 311 000 ensembles de données qui faisaient partie de la collection Data.gov.
Ces documents, provenant d’agences telles que la NASA et la National Science Foundation, fournissent des données essentielles pour les scientifiques et les ingénieurs. Si elles disparaissent, la validité des recherches et la précision historique sont menacées, comme l’a souligné Spectrum.
La suppression de données gouvernementales n’est pas un phénomène nouveau. Après le 11 septembre, l’administration Bush a supprimé des millions d’octets d’informations pour des raisons de sécurité. L’administration Obama a adopté une approche différente, lançant Data.gov en 2009 pour élargir l’accès du public, comme rapporté par Spectrum.
Pendant le premier mandat de Trump, des chercheurs de l’Initiative pour les Données et la Gouvernance Environnementales ont trouvé certains sites gouvernementaux inaccessibles, et les références au « changement climatique » ont été effacées de plusieurs pages, selon Spectrum.
Durant le second mandat de Trump, les préoccupations concernant la conservation des données se sont intensifiées. En février, le New York Times a rapporté que plus de 8 000 pages web et bases de données gouvernementales ont été retirées.
Certaines sont depuis réapparues, mais Grist a constaté des changements, y compris la suppression de termes tels que « changement climatique » et « énergie propre ». Le 11 février, des défis juridiques ont suivi, un juge fédéral a ordonné la restauration de certains ensembles de données du CDC et de la FDA, comme rapporté par Spectrum.
Pour lutter contre cette perte, les archivistes numériques ont pris des mesures. Le Library Innovation Lab de la Harvard Law School a copié l’intégralité de l’archive de 16 téraoctets de Data.gov, contenant plus de 311 000 ensembles de données. Ils utilisent des requêtes automatisées via les API pour la garder à jour quotidiennement.
Les archivistes jouent un rôle essentiel dans la sauvegarde des connaissances en conservant les archives historiques pour les générations futures. La perte d’informations vitales en leur absence aboutirait à la réécriture des archives publiques, limitant ainsi les possibilités de recherche future.
Laisser un commentaire
Annulez