FAQ zu Webarchivierung

Allgemeines

WARUM ARCHIVIERT DIE SCHWEIZERISCHE NATIONALBIBLIOTHEK DAS WEB?
Aufgabe der Schweizerischen Nationalbibliothek ist es, das kulturelle Erbe zu sammeln, zu archivieren und zugänglich zu machen. Dazu gehört auch, das digitale Wissen für die Zukunft zu sichern. Gemeinsam mit den Schweizer Kantonsbibliotheken und weiteren Spezialbibliotheken verfolgt die Schweizerische Nationalbibliothek mit Webarchiv Schweiz das Ziel, Teile des "schweizerischen Internets" aufzubewahren.

WELCHE STRATEGIEN WENDET DIE SCHWEIZERISCHE NATIONALBIBLIOTHEK BEI DER WEBARCHIVIERUNG AN?
Die Schweizerische Nationalbibliothek hat sich für eine selektive Strategie entschieden. Der Schwerpunkt liegt auf frei zugänglichen, landeskundlich relevanten Websites mit einem starken Bezug zur Schweiz: Websites über die Kantone und Gemeinden, spezifische Fachgebiete wie Sozialwissenschaften oder Schweizer Literatur. Die Auswahl treffen vor allem die Schweizer Kantonsbibliotheken und weitere Spezialbibliotheken. Bei speziellen Anlässen, die in der Schweiz stattfinden, werden Spezialsammlungen aufgebaut: Websites, die ein Ereignis wie die Eidgenössischen Wahlen 2011 dokumentieren, werden gesammelt und archiviert. Anhand der ausgewählten Websites sollen möglichst aussagekräftige Momentaufnahmen des schweizerischen Web geschaffen und für die Nachwelt festgehalten werden. Die Auswahlkriterien sind im Merkblatt Sammeln detailliert beschrieben. Von einem Domain-Harvesting (Top-Level-Domain .ch) sieht die Nationalbibliothek vorläufig ab.
DARF DIE SCHWEIZERISCHE NATIONALBIBLIOTHEK MEINE WEBSITE ARCHIVIEREN?
Die Schweizerische Nationalbibliothek hat den gesetzlichen Auftrag, sowohl gedruckte als auch elektronische Publikationen wie e-Books oder Websites mit Bezug zur Schweiz, zu sammeln, zu erschliessen, zu vermitteln und dauerhaft zu sichern. Die Website-Betreiber werden per E-Mail oder Brief über das bevorstehende Harvesting informiert und haben so die Möglichkeit, sich zur geplanten Archivierung ihrer Website zu äussern.
WAS IST DER UNTERSCHIED ZUM INTERNET ARCHIVE?
Das Internet Archive ist eine Non-Profit-Organisation, die 1996 in den USA gegründet wurde, mit dem Ziel, Forschenden weltweit Zugriff zu historischen digitalen Sammlungen zu ermöglichen. In Webarchiv Schweiz werden ausschliesslich Websites aus der .ch-Domain oder Websites mit einem starken Bezug zur Schweiz gesammelt und archiviert.
WIRD DAS WEBARCHIV KOMMERZIELL GENÜTZT?
Das gemeinsame Webarchiv der Schweizerischen Nationalbibliothek, der Schweizer Kantonsbibliotheken und weiterer Spezialbibliotheken dient historischen Zwecken und wird nicht kommerziell genützt. Webarchiv Schweiz steht den Benutzenden in den Räumlichkeiten der Nationalbibliothek und der Partnerbibliotheken unentgeltlich zur Verfügung.

KANN DIE ARCHIV-VERSION MIT DER AKTUELLEN VERSION MEINER WEBSITE VERWECHSELT WERDEN?
Der Zugriff auf die Websites ist nur in den Räumlichkeiten der Schweizerischen Nationalbibliothek und der Partnerbibliotheken möglich, nicht über das Internet. Zudem sind die Archivkopien klar als solche gekennzeichnet. Eine Verwechslung ist also nahezu ausgeschlossen.

WO MUSS ICH MICH MELDEN, UM NOCH MEHR INFORMATIONEN ZU WEBARCHIVIERUNG UND ZU WEBARCHIV SCHWEIZ ZU ERHALTEN?
Die Koordinationsstelle Webarchiv Schweiz steht für weitere Fragen, Anregungen und Kritik zur Verfügung.
WIE KANN ICH ALS BETREIBER EINER WEBSITE WEBARCHIV SCHWEIZ UNTERSTÜTZEN?
Das Ziel ist, in regelmässigen Abständen ein Abbild einer Website zu archivieren. Nicht immer sind Websites so gestaltet, dass der Harvester sie komplett einsammeln kann. Ein wichtiges Merkmal einer crawler-freundlichen Website sind Links im HTML- oder XHTML-Format, die nicht in Flash oder Javascript eingebettet sind. Zudem sind alternative Navigationsmöglichkeiten über eine textbasierte Version oder eine Sitemap hilfreich. Wenn Sie an weiteren Informationen interessiert sind, kontaktieren Sie bitte die Koordinationsstelle Webarchiv Schweiz.
WAS UNTERNIMMT DIE SCHWEIZERISCHE NATIONALBIBLIOTHEK, DAMIT DIE WEBSITES AUCH IN ZUKUNFT NOCH KONSULTIERT WERDEN KÖNNEN?
Das Modul Langzeiterhaltung des OAIS-Referenzmodells, an dem sich die Schweizerische Nationalbibliothek für die Archivierung von elektronischen Publikationen orientiert, ist noch in der Projektphase. In diesem Projekt werden Massnahmen zum Erhalt der Les- und Interpretierbarkeit der elektronischen Informationen erarbeitet. Damit die Schweizerische Nationalbibliothek die vollständige Les- und Interpretierbarkeit in Zukunft garantieren kann, müssen bei der Archivierung von elektronischen Publikationen nebst dem Erhalt der Information selber auch die Datenträger und die Systemumgebung berücksichtigt werden.

Sammlung

SIND IM WEBARCHIV SCHWEIZ ALLE SCHWEIZER WEBSITES ZU FINDEN?
Die Schweizerische Nationalbibliothek hat sich für das selektive Harvesting entschieden. Bei diesem Ansatz besteht die Herausforderung darin, aus dem grossen Angebot charakteristische Stellvertreter auszusuchen. Die Sammlung von Webarchiv Schweiz setzt sich hauptsächlich aus landeskundlich relevanten Websites der Schweiz zusammen. Es ist Aufgabe der Partnerbibliotheken (Schweizer Kantonsbibliotheken und weitere Spezialbibliotheken), aus dem Angebot ihrer Kantone und ihrer Fachgebiete eine sinnvolle und repräsentative Auswahl zu treffen. Die Auswahl wird anhand von gemeinsam erstellten Sammelrichtlinien (Merkblatt Sammeln) getroffen.
WER TRIFFT DIE AUSWAHL DER WEBSITES?
Die Auswahl der Websites treffen die Partnerbibliotheken von Webarchiv Schweiz, d.h. die Schweizer Kantonsbibliotheken und weitere Spezialbibliotheken. Die Auswahl wird anhand von gemeinsam erstellten Sammelrichtlinien (Merkblatt Sammeln) getroffen.
ICH GESTALTE EINE NEUE WEBSITE - KANN ICH SIE ZUR ARCHIVIERUNG ANMELDEN?
Nur die Partnerbibliotheken (Schweizer Kantonsbibliotheken und weitere Spezialbibliotheken) können Websites für die Sammlung von Webarchiv Schweiz auswählen und anmelden. Sie können die URL aber gerne an die Koordinationsstelle Webarchiv Schweiz der Schweizerischen Nationalbibliothek melden. Die Koordinationsstelle wird den Vorschlag an die zuständige Partnerbibliothek weiterleiten. Anhand der Sammelkriterien (Merkblatt Sammeln) wird dann entschieden, ob die Website ins Webarchiv Schweiz aufgenommen wird oder nicht.
MEINE WEBSITE VERFÜGT ÜBER EINEN PASSWORT GESCHÜTZTEN BEREICH - WIRD DIESER AUCH ARCHIVIERT?
In Webarchiv Schweiz werden nur frei über das Internet veröffentlichte und zugängliche Websites gesammelt und archiviert. Nicht archiviert werden z.B. Intranets oder private zugangsgeschützte Daten.

Einsammeln und Archivieren

WIE FUNKTIONIERT WEBARCHIVIERUNG? WELCHE SOFTWARE WIRD VERWENDET?
Die Schweizerische Nationalbibliothek verwendet zum Harvesting die Open Source Software Heritrix, die auf der ganzen Welt am häufigsten für die Webarchivierung eingesetzt wird. Zusätzlich unterstützt die Open Source Software PhantomJS den Crawler beim Auffinden aller relevanten Links. Der Heritrix Crawler folgt den Links innerhalb einer Webseite und sammelt alle gefundenen Dateien. Das Ziel ist, eine möglichst umfassende und in ihrer Darstellung korrekte Version der Website zu archivieren. Passwortgeschützte Seiten oder weiterführende Links zu externen Seiten werden nicht eingesammelt. Der Zugriff auf die eingesammelte Website erfolgt mittels der Wayback Machine.

IST DAS EINSAMMELN UND ARCHIVIEREN VON WEBSITES EINFACH - ODER GIBT ES TECHNISCHE GRENZEN?
Die Webarchivierung steht noch in den Anfängen. Es kann deshalb vorkommen, dass eine Website aus technischen Gründen nicht archiviert werden kann, obwohl sie den Sammelkriterien von Webarchiv Schweiz entsprechen würde. Da sich die Tools weiterhin verbessern werden, erhöht sich auch kontinuierlich die Qualität der Crawls. Weiter ist die Schweizerische Nationalbibliothek Mitglied von IIPC (International Internet Preservation Consortium) und steht somit im ständigen Austausch mit anderen Gedächtnisinstitutionen aus aller Welt, die Webarchivierung betreiben.

WARUM SIND EINIGE WEBSITES SCHWIERIGER ZU ARCHIVIEREN ALS ANDERE?
Grosse Datenmengen, fehlende Inhalte oder Menufunktionen, Flash-Animationen, dynamische scriptbasierte Funktionen, Crawler Traps wie Kalender oder Landkarten können das Archivieren erschweren. Über Aufnahme und Nicht-Aufnahme einer Website entscheiden die Bibliothekar/innen. Zu einem späteren Zeitpunkt wird versucht, einen Snapshot in besserer Qualität einzuholen. Websites können aber auch trotz Qualitätsmängeln archiviert werden, damit zumindest ein Nachweis vorhanden ist. Eine optisch fehlerhafte Darstellung einer Website ist bisweilen auch auf die Defizite der aktuellen Version der Wayback Machine zurückzuführen. Deshalb wird soweit möglich immer die neueste Version der Tools für die Webarchivierung eingesetzt.

Webarchiv Schweiz : Glossar, Version 1.6, 05.02.2016 (PDF, 186 kB, 09.02.2016)Das Glossar führt die in den Merkblättern des Webarchiv Schweiz verwendeten Fachbegriffe und Abkürzungen auf.

WARUM HABE ICH EINE E-MAIL/EINEN BRIEF MIT DEM BETREFF "ARCHIVIERUNG IHRER WEBSITE" ERHALTEN?
Diese Information verschickt die Schweizerische Nationalbibliothek an alle Website-Betreiber, deren Website für Webarchiv Schweiz ausgewählt worden ist. Dort steht, welche Ziele mit Webarchiv Schweiz verfolgt werden, wie das Harvesting durchgeführt wird und wo Sie sich melden können, wenn Sie Fragen haben oder weitere Informationen wünschen. Eine Rückmeldung ist nicht zwingend erforderlich, ausser Sie lehnen eine Archivierung Ihrer Website ab.
WIE OFT SAMMELT DIE SCHWEIZERISCHE NATIONALBIBLIOTHEK DIE WEBSITES EIN?
In der Regel wird die Website einmal im Jahr eingeholt. Weitere mögliche Sammelhäufigkeiten sind: einmalig, alle 4 Jahre, alle 2 Jahre und alle 6 Monate. Das Intervall ist stark von den Inhalten abhängig und kann für jede Website individuell bestimmt werden. Bei den Spezialsammlungen ist das Ereignis ausschlaggebend und das Intervall wird entsprechend angepasst.

MUSS ICH MEINE WEBSITE FÜR DIE WEBARCHIVIERUNG VORBEREITEN?
Für die Webarchivierung ist von Seiten des Website-Betreibers keinerlei Vorbereitung notwendig. Auch ist es nicht nötig, die Website vor dem Harvesting zu aktualisieren. In der Regel wird eine ausgewählte Website regelmässig (z.B. 1x pro Jahr) eingesammelt. Dadurch lässt sich der Wandel einer Website über die Jahre hinweg dokumentieren.
WIE STARK WIRD MEIN SERVER DURCH DEN CRAWLER BELASTET?
Der Webcrawler der Schweizerischen Nationalbibliothek ist so konfiguriert, dass die Serverbelastung möglichst gering gehalten wird. Sollten dennoch technische Probleme durch das Webharvesting entstehen, kontaktieren Sie bitte die Koordinationsstelle Webarchiv Schweiz:
WARUM WERDEN ROBOTS.TXT UND META-TAG ROBOTS VOM CRAWLER IGNORIERT?
Werden beim Harvesting robots.txt und robots-Meta-Tags berücksichtigt, besteht die Gefahr, dass die eingeholte Website nicht vollständig und in ihrer Darstellung nicht korrekt wiedergegeben wird. Um dies zu vermeiden, werden die robots.txt und robots-Meta-Tags nicht beachtet.

Webarchiv Schweiz : Glossar, Version 1.6, 05.02.2016 (PDF, 186 kB, 09.02.2016)Das Glossar führt die in den Merkblättern des Webarchiv Schweiz verwendeten Fachbegriffe und Abkürzungen auf.

WIRD MIR DIE ARCHIVIERUNG MEINER WEBSITE IN RECHNUNG GESTELLT?
Die Archivierung kostet für Betreiber einer Website nichts.

ICH MÖCHTE NICHT, DASS DIE SCHWEIZERISCHE NATIONALBIBLIOTHEK MEINE WEBSITE ARCHIVIERT. WAS KANN ICH TUN?
Wenn Sie Website-Betreiber sind und von der Schweizerischen Nationalbibliothek eine Information erhalten haben, dass Ihre Website eingesammelt und archiviert wird, können Sie sich bei der Koordinationsstelle Webarchiv Schweiz melden und Ihr Anliegen anbringen. Das Harvesting wird dann abgebrochen bzw. nicht gestartet. Für die Schweizerische Nationalbibliothek und die Partnerbibliotheken sowie für zukünftige Forschende ist es wichtig, dass möglichst viele Websites mit Bezug zur Schweiz gesammelt und archiviert werden können. So kann der historische Nutzen des Webarchivs über lange Zeit sichergestellt werden.
WAS PASSIERT MIT DEN WEBSITES, NACHDEM DER HARVESTER SIE EINGESAMMELT HAT?
Nach dem Harvesting wird die Qualität des Sammelvorgangs kontrolliert. Die Schweizerische Nationalbibliothek stellt die gesammelten Websites in eine in sich geschlossene Webumgebung und greift dort darauf zu, um systematisch manuelle Prüfvorgänge vorzunehmen. Wird die Qualität als genügend eingestuft, wird der Archivierungsvorgang fortgesetzt. Wird die Qualität als ungenügend eingestuft, wird das Harvesting mit anderen Einstellungen am Harvester wiederholt.
WIE WERDEN DIE ANGEMELDETEN WEBSITES ABGELEGT UND AUFBEWAHRT?
Das Ingest-System bereitet die Daten für die Archivierung auf und stellt sicher, dass die dazugehörenden Metadaten im Katalog der Schweizerischen Nationalbibliothek (Helveticat) zur Verfügung stehen. Gespeichert werden die Websites samt Metadaten im Langzeitarchiv. Im Langzeitarchiv dürfen eingelagerte Informationen nicht überschrieben oder gelöscht werden. Die Daten werden mit Backups gesichert, welche an zwei verschiedenen Standorten in Bern gelagert werden. Ein automatisierter Datenabgleich sorgt dafür, dass die gespeicherten Daten an beiden Standorten vollständig vorhanden sind. Am Sekundärstandort wird zusätzlich über ein IBM-Bandlaufwerk eine dritte Kopie der Daten auf Magnetband erstellt. Diese dritte Kopie wird separat aufbewahrt.
HOSTET DIE SCHWEIZERISCHE NATIONALBIBLIOTHEK MEINE WEBSITE AUCH?
Nein, Website-Betreiber sind nach wie vor selbst für das Hosting ihrer Website verantwortlich. Durch das regelmässige Harvesting werden lediglich Momentaufnahmen einer Website erstellt, die einzeln archiviert werden und dann zu wissenschaftlichen Zwecken genutzt werden können.

Nutzung

FINDE ICH MEINE WEBSITE IM BIBLIOTHEKSKATALOG HELVETICAT?
Mit der Archivierung der Website erfolgt ebenfalls eine Verzeichnung im Bibliothekskatalog Helveticat. Alle archivierten Websites sind in Helveticat erschlossen und auffindbar. Ein Link führt direkt auf die digitalen Sammlungen (e-Helvetica Access). Eine Verzeichnung im Schweizer Buch, der Nationalbibliographie der Schweizerischen Nationalbibliothek, erfolgt hingegen nicht.
WIE KANN ICH AUF DIE ARCHIVIERTEN WEBSITES ZUGREIFEN?
Die archivierten Websites können in e-Helvetica Access, dem Zugriffssystem zu den digitalen Sammlungen, recherchiert und angezeigt werden. Aus rechtlichen Gründen ist der Zugriff auf das Webarchiv nur in den Räumlichkeiten der Schweizerischen Nationalbibliothek und der Partnerbibliotheken möglich.
WAS IST DER UNTERSCHIED ZWISCHEN HELVETICAT UND E-HELVETICA ACCESS?
Helveticat ist der Online-Katalog der Schweizerischen Nationalbibliothek. Es sind sowohl gedruckte als auch elektronische Publikationen verzeichnet.

e-Helvetica Access ist das Zugriffssystem für die digitalen Sammlungen der Schweizerischen Nationalbibliothek. Neben Websites sind auch e-Books, e-Journals, elektronische Hochschulschriften und elektronische amtliche Schriften verzeichnet. Zudem können gedruckte Werke abgerufen werden, die nachträglich digitalisiert wurden.
ICH SUCHE WEBSITES. WIE MUSS ICH SUCHEN?
Sie können sowohl im Online-Katalog Helveticat als auch in e-Helvetica Access, dem Zugriffssystem zu den digitalen Sammlungen, nach Websites suchen.
In Helveticat können Sie spezifisch mit einem Auszugscode, einer URL, einer Dewey oder nach der Sprache suchen. Eine genaue Erklärung finden Sie in der Anleitung zur Suche von Websites. e-Helvetica Access bietet eine Suche speziell für Websites an (Webarchiv-Suche). Mehr Informationen zu den einzelnen Suchen finden Sie in den Hilfstexten (Symbol Rettungsring) von e-Helvetica Access.
WARUM KANN ICH DIE ARCHIVIERTE WEBSITE NICHT VON ZUHAUSE AUS ANSCHAUEN?
Die Verfügbarkeit der Websites richtet sich nach den rechtlichen Rahmenbedingungen. Websites sind urheberrechtlich geschützt und nur in den Publikumsräumen der Schweizerischen Nationalbibliothek einsehbar.

DARF ICH WEBSITES AUSDRUCKEN?
Aus urheberrechtlichen Gründen muss der Zugriff auf die archivierten Zeitschnitte eingeschränkt werden. Jegliche Vervielfältigungsmöglichkeiten wie Speichern, Drucken usw. sind deshalb nicht möglich.

WARUM SAMMELT DIE SCHWEIZERISCHE NATIONALBIBLIOTHEK MEINE WEBSITE? ES GIBT DOCH GOOGLE!
Die Schweizerische Nationalbibliothek hat den gesetzlichen Auftrag, elektronische Publikationen mit Bezug zur Schweiz zu sammeln. Das Ziel von Webarchiv Schweiz ist nicht, einen zusätzlichen Zugriff auf Informationen zu bieten, die zurzeit auf Ihrer Website aufgeführt sind, sondern den Wandel von Websites über Jahre und Jahrzehnte hinweg zu dokumentieren: Zum Beispiel hätte man im Jahre 2025 Zugang zu Ihrer Website wie sie 2015 aussah. Zu diesem Zweck sammeln wir regelmässig eine "Kopie" von allen ausgewählten Websites. Diese Kopien erlauben es, die Veränderungen der Websites im Laufe der Jahre festzuhalten.

WELCHE VORTEILE HAT MEINE GEMEINDE, WENN UNSERE WEBSITE VON DER SCHWEIZE-RISCHEN NATIONALBIBLIOTHEK ARCHIVIERT WIRD?
Die Schweizerische Nationalbibliothek hat sich aufgrund ihres gesetzlichen Auftrags zum Ziel gesetzt, eine selektive Sammlung von landeskundlich relevanten Websites der Schweiz aufzubauen. Mit Ihrer Zustimmung, die Website ins Webarchiv Schweiz aufnehmen zu dürfen, tragen Sie dazu bei, eine interessante Sammlung aufzubauen, die als Grundlage für historische Forschung dient. Der Zeitschnitt Ihre Website wird ausserdem langzeitarchiviert, ohne dass das für Sie mit Arbeit und Kosten verbunden ist. Im Laufe der Jahre lassen sich so Änderungen in Bezug auf Inhalte und optische Gestaltung dokumentieren.

Kontakt

Schweizerische Nationalbibliothek
e-Helvetica
Koordinationsstelle Webarchiv Schweiz
Schweiz

Kontaktinformationen drucken

https://www.nb.admin.ch/content/snl/de/home/nb-professionell/e-helvetica/infos-fuer-anbieter-innen/websites-_-webarchiv-schweiz/faq-zu-webarchivierung.html