15 décembre 2005
TIC- Sauvegarder le Web, un défi pour la BNF et les autres
Habilitée d'ici peu à réaliser le dépôt légal de l'Internet, c'est-à-dire à collecter et conserver tous les documents du réseau, la Bibliothèque Nationale de France se prépare, tout comme ses consoeurs européennes, à un véritable défi technologique et documentaire (voir l'Expansion, 14/12/05).
La croissance continue du Web et son caractère dynamique et éphémère, posent de véritables problèmes pour sa sauvegarde à long terme.
Plusieurs pays, parmi lesquels le Canada, le Danemark, la Nouvelle-Zélande, la Norvège, l'Afrique du Sud et le Royaume-Uni ont promulgué une loi pour étendre le dépôt légal aux publications numériques. En France, la question est d'actualité avec le projet DADVSI.
A l'instar de la BNF (en collaboration avec l'INA), plusieurs bibliothèques nationales, comme celles de l'Autriche, de la République Tchèque, du Danemark, de la Finlande, de l'Allemagne, de la Lituanie, des Pays-Bas, de la Norvège, de la Suède et du Royaume-Uni ont commencé à constituer des archives numériques à l'échelle nationale en utilisant diverses approches :
- la sauvegarde sélective des ressources statiques du Web, c’est-à-dire des ressources qui ne changent pas ou qui ne contiennent pas d'éléments interactifs ou dynamiques. Le Danemark, le Canada et le Japon sont les principaux adeptes de cette approche ;
- la sauvegarde sélective des ressources statiques et dynamiques du Web. C'est l'approche de l'Australie ;
- la capture complète d’un domaine, c’est-à-dire, la récolte automatique du Web d'un pays entier en faisant l’usage de robots de collecte et d'un minimum d'intervention humaine. La Suède, la Finlande, l'Islande et la Norvège appliquent cette approche ;
- la combinaison des techniques de sélection et de capture de domaine. Le robot programmé par la BNF stocke de manière automatique et sélective les ressources qui peuvent présenter une valeur pour la recherche ;
- la sauvegarde basée sur des accords de collaboration avec les éditeurs commerciaux. La Bibliothèque Nationale des Pays-Bas a développé une infrastructure technique commune avec les organisations professionnelles et les éditeurs commerciaux, pour archiver, préserver et fournir un accès limité à l'ensemble des oeuvres numériques. Elle reconnaît de même, la nécessité de travailler avec les éditeurs sur l'archivage du « Web invisible », qui reste hors de portée des moteurs de recherche, et qui contient une énorme quantité d'informations de grande valeur.
Les tentatives de sauvegarde du Web sont encore en grande partie expérimentales. Pour une approche plus détaillée, se référer à l'étude de Michael Day de l'Université de Bath au Royaume-Uni, "Collecting and preserving the World Wide Web", 2003.