Début secteur de contenu

Début navigateur

Fin navigateur

Imprimer     


FAQ sur l’archivage web

Généralités

POURQUOI LA BIBLIOTHEQUE NATIONALE SUISSE ARCHIVE-T-ELLE LE WEB ?
La Bibliothèque nationale suisse a pour mandat de collectionner, d'archiver et de rendre accessible le patrimoine culturel. Ce mandat inclut également la sauvegarde du savoir numérique pour les générations futures. Dans le cadre des Archives Web Suisse qu'elle constitue en collaboration avec les bibliothèques cantonales suisses et d'autres bibliothèques spécialisées, la Bibliothèque nationale suisse se fixe pour objectif de conserver des parties de l'"internet suisse".

QUELLES STRATEGIES LA BIBLIOTHEQUE NATIONALE SUISSE APPLIQUE-T-ELLE POUR L'ARCHIVAGE DU WEB ?
La Bibliothèque nationale suisse a opté pour une stratégie sélective. Elle met l'accent sur les sites web patrimoniaux qui ont un fort lien avec la Suisse et qui sont accessibles librement : sites web sur les cantons et les communes, domaines spécifiques tels que sciences sociales ou littérature suisse. Ce sont avant tout les bibliothèques cantonales et d'autres bibliothèques spécialisées qui sélectionnent les sites web. Des collections spéciales sont constituées à l'occasion de manifestations spéciales qui ont lieu en Suisse : les sites web concernant un évènement comme les élections fédérales de 2011 sont alors collectés et archivés. La sélection de sites web permet de créer des instantanés du web suisse et de les enregistrer pour la postérité. Les critères de sélection sont décrits en détail dans la notice Collecte. La Bibliothèque nationale renonce pour l'instant à un harvesting du domaine .ch.
LA BIBLIOTHEQUE NATIONALE SUISSE A-T-ELLE LE DROIT D'ARCHIVER MON SITE WEB?
La Bibliothèque nationale suisse a pour mandat légal de collectionner, de répertorier, de mettre à disposition et de conserver durablement les publications imprimées ainsi que les publications électroniques comme des e-books ou des sites web ayant un lien avec la Suisse. Les exploitants de sites web sont informés par mail ou par courrier de l'imminence du harvesting et ont donc la possibilité de réagir à l'archivage de leur site web.
QUELLE EST LA DIFFERENCE AVEC INTERNET ARCHIVE?
Internet Archive est une organisation à but non lucratif qui a été fondée en 1996 aux USA dans le but de faciliter aux chercheurs du monde entier l'accès aux collections historiques numériques. Archives Web Suisse collectionne et archive uniquement les sites web du domaine .ch ou les sites web ayant un fort lien avec la Suisse.
LES ARCHIVES WEB SONT-ELLES UTILISEES A DES FINS COMMERCIALES?
Les archives web communes de la Bibliothèque nationale suisse, des bibliothèques cantonales suisses et d'autres bibliothèques spécialisées servent à des fins historiques et ne sont pas utilisées à des fins commerciales. Archives Web Suisse est disponible gratuitement dans les locaux de la Bibliothèque nationale et des bibliothèques partenaires.

RISQUE-T-ON DE CONFONDRE LA VERSION D'ARCHIVE AVEC LA VERSION ACTUELLE DE MON SITE WEB?
L'accès aux sites web archivés n'est possible que dans les locaux de la Bibliothèque nationale suisse et des bibliothèques partenaires, et non pas par Internet. De plus, les copies d'archive sont clairement signalées comme telles. Une confusion est donc quasiment exclue.

OÙ DOIS-JE M'ADRESSER POUR OBTENIR PLUS D'INFORMATIONS SUR L'ARCHIVAGE WEB ET ARCHIVES WEB SUISSE?
Le service de coordination d'Archives Web Suisse se tient à votre disposition pour répondre à vos questions, suggestions et critiques.
COMMENT PUIS-JE SOUTENIR ARCHIVES WEB SUISSE EN TANT QU'EXPLOITANT D'UN SITE WEB?
Le but est d'archiver une copie d'un site web à intervalles réguliers. Les sites web ne se présentent pas toujours sous une forme qui permette au harvester de les collecter dans leur intégralité. Un site web facile à harvester se distingue notamment par des liens en format HTML ou XHTML qui ne sont pas intégrés dans Flash ou Javascript. D'autres possibilités de navigation par une version basée sur du texte ou un plan du site sont également une aide. Si vous souhaitez en savoir davantage, vous pouvez contacter le service de coordination d'Archives Web Suisse.
QUELLES ACTIONS LA BIBLIOTHEQUE NATIONALE SUISSE ENTREPREND-ELLE POUR QUE LES SITES WEB PUISSENT ENCORE ETRE CONSULTES DANS LE FUTUR?
Le module de conservation à long terme du modèle de référence OAIS, sur lequel se base la Bibliothèque nationale suisse pour l'archivage de publications électroniques, est encore au stade de projet. Ce projet élabore des mesures afin de conserver la lisibilité et l'interprétabilité des informations électroniques. Afin que la Bibliothèque nationale suisse puisse garantir une lisibilité et une interprétabilité complètes dans le futur, il faut non seulement conserver l'information au moment de l'archivage des publications électroniques, mais également prendre en compte les supports de données et l'environnement système.

Collection

TROUVE-T-ON TOUS LES SITES WEB SUISSES DANS ARCHIVES WEB SUISSE?
La Bibliothèque nationale suisse a opté pour un harvesting sélectif. Avec une telle approche, le défi est de sélectionner des sites web représentatifs dans la masse de sites web. La collection d'Archives Web Suisse se compose principalement de sites web patrimoniaux de la Suisse. Il est du ressort des bibliothèques partenaires (bibliothèques cantonales suisses et autres bibliothèques spécialisées) de faire un choix judicieux et représentatif des sites web de leurs cantons et de leurs domaines de spécialisation. La sélection se base sur des directives de collecte (notice Collecte) établies en commun.
QUI SELECTIONNE LES SITES WEB?
Le choix des sites web est fait par les bibliothèques partenaires d'Archives Web Suisse, c'est-à-dire par les bibliothèques cantonales suisses et d'autres bibliothèques spécialisées. La sélection se base sur des directives de collecte (notice Collecte) établies en commun.
JE CREE UN NOUVEAU SITE WEB ─ PUIS-JE L'ANNONCER POUR L'ARCHIVAGE?
Seules les bibliothèques partenaires (les bibliothèques cantonales suisses et d'autres bibliothèques spécialisées) peuvent sélectionner et annoncer des sites web pour la collection d'Archives Web Suisse. Vous pouvez cependant annoncer l'URL de votre site web au service de coordination d'Archives Web Suisse de la Bibliothèque nationale suisse, qui transmettra votre proposition à la bibliothèque compétente. La décision d'intégrer ou non le site web aux Archives Web Suisse sera prise sur la base des critères de collecte (notice Collecte).
MON SITE WEB COMPREND UN DOMAINE PROTEGE PAR MOT DE PASSE ─ CE DERNIER EST-IL AUSSI ARCHIVE?
Archives Web Suisse ne collecte et n'archive que des sites web publiés et accessibles librement par l'internet. Par exemple, les intranets ou les données privées d'accès protégé ne sont pas archivés.

Collecter et archiver

COMMENT FONCTIONNE L'ARCHIVAGE WEB? QUEL LOGICIEL EST UTILISE?
Pour le harvesting, la Bibliothèque nationale suisse utilise le logiciel open source Heritrix, qui est le plus utilisé dans le monde entier pour l'archivage du web. En plus, le logiciel open source PhantomJS aide le crawler à retrouver tous les liens pertinents. Le crawler Heritrix suit les liens d'une page web et collecte tous les fichiers trouvés. Le but est d'archiver une version du site web si possible complète et de présentation correcte. Les pages protégées par mot de passe ou les liens pointant sur des pages externes ne peuvent pas être collectés. L'accès au site web collecté se fait au moyen de la Wayback Machine.

EST-IL SIMPLE DE COLLECTER ET D'ARCHIVER DES SITES WEB, OU Y A-T-IL DES LIMITES TECHNIQUES?
L'archivage web en est encore à ses débuts. Il peut donc arriver qu'un site web ne puisse être archivé pour des raisons techniques, bien qu'il réponde aux critères de collecte d'Archives Web Suisse. Etant donné que les outils vont continuer de s'améliorer, la qualité des crawls va augmenter continuellement. De plus, la Bibliothèque nationale suisse est membre d'IIPC (International Internet Preservation Consortium) et échange constamment des informations avec des institutions patrimoniales du monde entier qui s'occupent d'archivage web.

POURQUOI CERTAINS SITES WEB SONT-ILS PLUS DIFFICILES A ARCHIVER QUE D'AUTRES?
L'archivage peut être plus difficile en cas de grandes quantités de données, de contenus ou de fonctions de menu manquants, d'animations flash, de fonctions dynamiques basées sur des scripts, de crawler traps comme des calendriers ou des cartes topographiques. Ces sont les bibliothécaires qui décident d'inclure ou non un site web. Ultérieurement, nous essayons de collecter un snapshot de meilleure qualité. Même si sa qualité est lacunaire, un site web peut quand même être archivé afin qu'il soit au moins enregistré. Une présentation visuellement lacunaire d'un site web est parfois aussi due aux manques de l'actuelle version de la Wayback Machine. Nous nous efforçons donc autant que possible d'utiliser la version la plus récente des outils d'archivage du web.
Typ: PDF
Archives Web Suisse : glossaire, version 1.6, 5 février 2016
Le glossaire contient le vocabulaire professionnel et les abréviations utilisés dans les notices des Archives Web Suisse.
Dernière modification: 09.02.2016 | Dimension: 142 kb | Typ: PDF

POURQUOI AI-JE RECU UN COURRIEL/UNE LETTRE AVEC L'OBJET „ARCHIVAGE DE VOTRE SITE WEB"?
La Bibliothèque nationale suisse envoie cette information à tous les exploitants de sites web dont le site web a été sélectionné pour Archives Web Suisse. Elle y mentionne les objectifs d'Archives Web Suisse, décrit le déroulement du harvesting et indique à qui vous adresser si vous avez des questions ou souhaitez d'autres informations. Une réponse n'est pas impérative, à moins que vous ne refusiez l'archivage de votre site web.
A QUELLE FREQUENCE LA BIBLIOTHEQUE NATIONALE SUISSE COLLECTE-T-ELLE LES SITES WEB?
En règle générale, le site web est collecté une fois par an. D'autres fréquences de collecte possibles sont: unique, tous les 4 ans, tous les 2 ans et tous les 6 mois. L'intervalle dépend fortement des contenus du site web et peut être déterminé individuellement pour chaque site web. Pour les collections spéciales, c'est l'événement qui est déterminant et l'intervalle est adapté en conséquence.

DOIS-JE PREPARER MON SITE WEB POUR L'ARCHIVAGE WEB?
L'exploitant du site web n'a rien besoin de préparer pour l'archivage web. Il n'est pas non plus nécessaire d'actualiser le site web avant le harvesting. En règle générale, un site web sélectionné est téléchargé régulièrement (par ex. 1x par année), ce qui permet de documenter son évolution au fil des années.
A QUEL POINT LE CRAWLER CHARGE-T-IL MON SERVEUR?
Le crawler web de la Bibliothèque nationale suisse est configuré de sorte à exercer la charge la plus faible possible sur le serveur. S'il devait toutefois y avoir des problèmes techniques à cause du web-harvesting, veuillez SVP contacter le service de coordination d'Archives Web Suisse:
POURQUOI ROBOTS.TXT ET LES META-TAGS ROBOTS SONT-ILS IGNORES PAR LE CRA-WLER?
Si l'on prend en compte robots.txt et les méta-tags robots lors du harvesting, l'on risque que le site web téléchargé ne soit pas complet et que sa présentation ne soit pas correcte. C'est pour éviter cela que robots.txt et les méta-tags robots ne sont pas pris en compte.
Typ: PDF
Archives Web Suisse : glossaire, version 1.6, 5 février 2016
Le glossaire contient le vocabulaire professionnel et les abréviations utilisés dans les notices des Archives Web Suisse.
Dernière modification: 09.02.2016 | Dimension: 142 kb | Typ: PDF

L'ARCHIVAGE DE MON SITE WEB M'EST-IL FACTURE?
L'archivage ne coûte rien à l'exploitant d'un site web.

JE NE SOUHAITE PAS QUE LA BIBLIOTHEQUE NATIONALE SUISSE ARCHIVE MON SITE WEB. QUE PUIS-JE FAIRE?
Si vous êtes exploitant d'un site web et que vous avez reçu de la Bibliothèque nationale suisse un message vous informant que votre site web va être téléchargé et archivé, vous pouvez vous adresser au service de coordination d'Archives Web Suisse et y déposer votre requête. Le harvesting est alors interrompu, autrement dit il n'est pas démarré du tout. Pour la Bibliothèque nationale suisse, pour les bibliothèques partenaires ainsi que pour les futurs chercheurs, il est toutefois important que le plus grand nombre possible de sites web ayant un rapport avec la Suisse puisse être collecté et archivé. C'est de cette façon que l'intérêt historique des archives web pourra être garanti à long terme.
QU'ARRIVE-T-IL AUX SITES WEB UNE FOIS COLLECTES PAR LE HARVESTER?
Après le harvesting, la qualité du processus de collecte est contrôlée. La Bibliothèque nationale suisse met les sites web collectés dans un environnement web fermé et y accède pour procéder à des tests manuels systématiques. Si la qualité est jugée suffisante, le processus d'archivage continue. Si la qualité est jugée insuffisante, les paramètres du harvester sont modifiés et l'on répète le harvesting.
COMMENT LES SITES WEB ANNONCES SONT-ILS STOCKES ET CONSERVES?
Le système Ingest prépare les données pour l'archivage et fait en sorte que les métadonnées correspondantes soient disponibles dans le catalogue de la Bibliothèque nationale suisse (Helveticat). Les sites web sont stockés avec leurs métadonnées dans l'archive à long terme. Dans cette archive, les informations stockées ne doivent pas être écrasées ou effacées. Les données sont sauvegardées par des backups qui sont stockés à deux emplacements différents à Berne. Grâce à une synchronisation automatisée des données, les données stockées aux deux emplacements sont complètes. A l'emplacement secondaire, une troisième copie des données est faite sur bande magnétique via un lecteur à bandes. Cette troisième copie est conservée séparément.
LA BIBLIOTHEQUE NATIONALE SUISSE HEBERGE-T-ELLE EGALEMENT MON SITE WEB?
Non, les exploitants de sites web sont toujours responsables de l'hébergement de leur site web. Le harvesting régulier permet juste de créer des enregistrements momentanés d'un site web qui sont archivés séparément et peuvent être utilisés à des fins scientifiques.

Utilisation

EST-CE QUE JE TROUVE MON SITE WEB DANS LE CATALOGUE HELVETICAT?
En même temps que l'archivage du site web, ce dernier est répertorié dans le catalogue Helveticat. Tous les sites web archivés sont catalogués et recherchables dans Helveticat. Un lien pointe directement sur les collections numériques (e-Helvetica Access). En revanche, les sites web ne sont pas répertoriés dans le Livre suisse, la bibliographie nationale de la Bibliothèque nationale suisse.
COMMENT PUIS-JE ACCEDER AUX SITES WEB ARCHIVES?
Les sites web archivés peuvent être recherchés et affichés dans e-Helvetica Access, le système d'accès aux collections numériques. Pour des raisons juridiques, l'accès aux archives web n'est possible que dans les locaux de la Bibliothèque nationale suisse et des bibliothèques partenaires.
QUELLE EST LA DIFFERENCE ENTRE HELVETICAT ET E-HELVETICA ACCESS?
Helveticat est le catalogue en ligne de la Bibliothèque nationale suisse. Il répertorie des publications imprimées ainsi que des publications électroniques.
e-Helvetica Access est le système d'accès pour les collections numériques de la Bibliothèque nationale suisse. Il répertorie non seulement des sites web, mais aussi des e-books, des e-journals, des thèses électroniques et des publications officielles électroniques. Il est également possible de consulter des œuvres imprimées qui ont été numérisées.
JE CHERCHE DES SITES WEB. COMMENT DOIS-JE RECHERCHER?
Vous pouvez rechercher des sites web non seulement dans le catalogue en ligne Helveticat, mais aussi dans e-Helvetica Access, le système d'accès aux collections numériques.
Dans Helveticat vous pouvez rechercher spécifiquement au moyen d'un code d'extraction, une URL, un Dewey ou selon la langue. Une explication détaillée se trouve dans le mode d'emploi pour la recherche de sites web. e-Helvetica Access propose une recherche particulière pour les sites web (Archives Web). Vous trouverez plus d'informations pour chacune des recherches au moyen des textes d'aide d'e-Helvetica Access (symbole de la bouée).
POURQUOI NE PUIS-JE PAS CONSULTER LE SITE WEB ARCHIVE DEPUIS CHEZ MOI?
La disponibilité des sites web dépend des conditions-cadres juridiques. Les sites web sont protégés par le droit d'auteur et ne peuvent être consultés que dans les salles publiques de la Bibliothèque nationale suisse.

SUIS-JE AUTORISE A IMPRIMER DES SITES WEB?
Pour des raisons de droit d'auteur, l'accès aux instantanés archivés est limité. Toute possibilité de reproduction ─ comme la sauvegarde, l'impression etc. ─ est donc bloquée.

POURQUOI LA BIBLIOTHEQUE NATIONALE SUISSE COLLECTIONNE-T-ELLE MON SITE WEB? IL Y A GOOGLE, NON?
La Bibliothèque nationale suisse a pour mandat légal de collectionner les publications électroniques ayant un lien avec la Suisse. Le but d'Archives Web Suisse n'est pas d'offrir un accès supplémentaire aux informations qui se trouvent actuellement sur votre site web, mais de documenter l'évolution des sites web au fil des années et des décennies. Par exemple, en 2025, on pourrait accéder à votre site web tel qu'il se présentait en 2015. A cet effet, nous collectons régulièrement une " copie " de tous les sites web sélectionnés. Ces copies permettent de retracer les modifications des sites web au fil des années.

DE QUELS AVANTAGES PROFITE MA COMMUNE SI NOTRE SITE WEB EST ARCHIVE PAR LA BIBLIOTHEQUE NATIONALE SUISSE?
Au vu de son mandat légal, la Bibliothèque nationale suisse s'est fixé pour objectif de constituer une collection sélective de sites web patrimoniaux de la Suisse. En acceptant que votre site web soit intégré aux Archives Web Suisse, vous contribuez à la mise sur pied d'une collection intéressante qui sert de base à la recherche historique. De plus, l'instantané de votre site web est archivé à long terme sans que cela ne vous demande d'investissement en temps de travail et en coûts. L'archivage des instantanés permet de retracer les modifications du contenu et de la présentation visuelle de votre site web.
Retour à la vue d’ensemble Sites web

Fin secteur de contenu

Recherche plein texte

Contacts

Bibliothèque nationale suisse
Coordination d’Archives Web Suisse
e-Helvetica
E Courriel


http://www.nb.admin.ch/nb_professionnel/01693/01695/01705/03333/index.html?lang=fr