La Bibliothèque nationale suisse a pour mandat légal de collectionner et de conserver les informations sur la Suisse et de les mettre à disposition à long terme. Les sites Internet sont eux aussi concernés ; bon nombre de données ne sont plus publiées sur papier mais sur Internet.
La Bibliothèque nationale assure l’archivage web en collaboration avec d’autres institutions de mémoire suisses. Elle travaille en partenariat avec les bibliothèques cantonales et avec d’autres archives et bibliothèques spécialisées. Vous trouverez la liste complète de ses partenaires dans le document de base sur Archives Web Suisse.
Archives Web Suisse: Bases, 03.07.2024 (PDF, 264 kB, 04.07.2024)Le document de base décrit l'origine et la démarche, le contenu et les objectifs, les étapes de travail ainsi que l'organisation d'Archives Web Suisse.
La Bibliothèque nationale ne procède pas à une indexation des sites par domaine et n’enregistre donc pas automatiquement tous les sites dont le nom de domaine se termine par l’extension .ch. Il n’existe aucune base légale prévoyant une telle procédure : en Suisse, les médias en ligne numériques ne sont pas soumis au dépôt légal. La Bibliothèque nationale opère donc une sélection des sites qu’elle souhaite archiver.
Internet Archive est une organisation à but non lucratif fondée en 1996 à San Francisco qui copie des sites Internet du monde entier et les rend accessibles gratuitement sur sa Wayback Machine. Archives Web Suisse indexe uniquement les sites ayant un fort lien avec la Suisse, qu’ils se terminent ou non par l’extension .ch.
Avec l’approche adoptée par la BN, le défi est d’opérer une sélection judicieuse et représentative parmi l’importante quantité de sites existants. Cette tâche incombe aux partenaires d’Archives Web Suisse, c’est-à-dire les bibliothèques cantonales suisses, d’autres bibliothèques et archives spécialisées et la Bibliothèque nationale elle-même. Chaque institution apporte sa pierre à l’édifice grâce à son savoir-faire spécialisé.
Les sites doivent être accessibles gratuitement sur Internet et avoir un fort lien avec la Suisse. Les critères de sélection sont décrits en détail dans la notice Collecte.
Archives Web Suisse: Notice Collecte, version 2.4, 23.07.2024 (PDF, 1 MB, 07.08.2024)La notice Collecte contient les bases de la création d'une collection de sites internet d'importance patrimoniale, définit les domaines de collecte et les critères de sélection.
Vous pouvez annoncer votre site Internet en envoyant un e-mail au service de coordination d’Archives Web Suisse, qui examinera votre proposition et, sur la base des directives de collection, décidera d’intégrer ou non le site aux archives.
Pour copier les sites Internet, la Bibliothèque nationale utilise un robot d’indexation : le logiciel open source Heritrix. En outre, le logiciel open source PhantomJS aide le robot à retrouver tous les liens pertinents. Le robot d’indexation Heritrix suit les liens d’une page web, collecte tous les fichiers trouvés et les copie sur le serveur de la Bibliothèque nationale. Le but est d’archiver une version du site Internet la plus complète possible et de présentation correcte. Les pages protégées par mot de passe ou les liens vers des pages externes ne sont pas collectés. Vous trouverez une description détaillée de ce processus dans la notice Archivage.
Archives Web Suisse: Notice Archivage, version 1.7, 19.04.2024 (PDF, 1 MB, 22.04.2024)La notice Archivage décrit comment les sites internet annoncés par les institutions partenaires sont traités et conservés dans le système de la BN. Par exemple, les étapes suivantes du processus sont décrites: le téléchargement (harvesting), la gestion de la qualité et le stockage des données.
En règle générale, un site Internet est archivé tous les 2 ans. D’autres fréquences d’archivage possibles sont : une seule fois ou tous les 4 ans. L’intervalle dépend fortement des contenus du site Internet et peut être déterminé individuellement pour chaque site.
La Bibliothèque nationale suisse envoie cette information à tous les propriétaires de sites Internet dont le site a été sélectionné pour Archives Web Suisse. Elle y donne des informations sur l’objectif de l’archivage, le processus de copie et la mise à disposition des sites. Une réponse n’est pas impérative, à moins que vous ne refusiez l’archivage de votre site Internet.
Non, l’archivage est gratuit.
Non, les propriétaires de sites Internet sont toujours responsables de l’hébergement de leur site. Les copies régulières permettent seulement de créer des instantanés d’un site Internet qui sont archivés séparément et peuvent ensuite être utilisés à des fins scientifiques.
Vous n’avez rien besoin de préparer. Il n’est pas non plus nécessaire d’actualiser le site Internet avant la copie. En règle générale, les sites Internet sélectionnés sont archivés régulièrement (tous les 2 ans), ce qui permet de documenter leur évolution au fil des années.
Le robot d’indexation de la Bibliothèque nationale est configuré de sorte à exercer sur le serveur la charge la plus faible possible. S’il devait toutefois y avoir des problèmes techniques lors de la copie, veuillez contacter le service de coordination d’Archives Web Suisse. Sur demande, la vitesse du processus peut être ralentie.
Les domaines protégés (intranets ou données privées dont l’accès est protégé, par exemple) ne sont pas copiés. Archives Web Suisse ne contient que des contenus publiés et accessibles librement sur Internet.
Si l’on prend en compte robots.txt et les méta-tags robots lors de la copie, l’on risque que le site Internet archivé ne soit pas complet et que sa présentation ne soit pas correcte. C’est pour éviter cela que robots.txt et les méta-tags robots ne sont pas pris en compte.
Il arrive que, pour des raisons techniques, un site Internet ne puisse pas être archivé, même s’il répond aux critères de collecte d’Archives Web Suisse.
L’archivage peut être plus difficile en cas de grandes quantités de données, de contenus ou de fonctions de menu manquants, d’animations flash, de fonctions dynamiques basées sur des scripts, ou de crawler traps comme des calendriers ou des cartes géographiques. Certains sites Internet présentant des défauts de qualité sont malgré tout archivés afin d’en garder au moins une trace. La représentation visuelle erronée d’un site Internet peut aussi être due aux lacunes des outils de visualisation (la Wayback Machine, par exemple).
Un site Internet facile à indexer se distingue notamment par des liens en format HTML ou XHTML et ne fonctionnant pas avec Flash ou Javascript. Proposer des options de navigation alternatives par une version basée sur du texte ou un plan du site peut s’avérer utile. Si vous souhaitez davantage d’informations à ce sujet, vous pouvez contacter le service de coordination d'Archives Web Suisse.
Si vous êtes propriétaire d’un site Internet et que vous avez reçu de la Bibliothèque nationale un message vous informant que votre site va être téléchargé et archivé, vous pouvez adresser votre demande au service de coordination d’Archives Web Suisse.
Il est possible d’afficher les sites Internet archivés et d’y effectuer des recherches plein texte dans e-Helvetica Access, le portail d’accès aux collections numériques. Pour des questions de droit d’auteur, l’accès aux archives web n’est possible que dans les locaux de la Bibliothèque nationale suisse et des institutions partenaires. Toute reproduction (sauvegarde, impression, etc.) est interdite.
Archives Web Suisse sert à des fins de recherche historique et n’est pas utilisé à des fins commerciales. Archives Web Suisse est disponible gratuitement dans les locaux de la Bibliothèque nationale et des institutions partenaires.
Le service de coordination d’Archives Web Suisse se tient à disposition pour répondre à vos demandes de renseignements.