FAQ sull’archiviazione web

Varia

PERCHÉ LA BIBLIOTECA NAZIONALE SVIZZERA ARCHIVIA IL WEB?
Il compito della Biblioteca nazionale svizzera consiste nel collezionare, archiviare e rendere accessibile il patrimonio culturale, incluso quello di garantire alle generazioni future il sapere digitale. Con Archivio Web Svizzera, la Biblioteca nazionale svizzera, in collaborazione con le biblioteche cantonali svizzere e altre biblioteche specializzate, si prefigge di conservare parti dell'«Internet svizzero».

QUALI STRATEGIE APPLICA LA BIBLIOTECA NAZIONALE SVIZZERA NELL'ARCHIVIARE IL WEB?
La Biblioteca nazionale svizzera ha scelto una strategia selettiva. La priorità è data ai siti web liberamente accessibili, rilevanti per la geografia e la storia e strettamente connessi con la Svizzera. In questo modo vengono collezionati e archiviati siti web che riguardano i Cantoni e Comuni ma anche settori specifici, per esempio le scienze sociali e la letteratura svizzera. La selezione è decisa soprattutto dalle biblioteche cantonali svizzere e da altre biblioteche specializzate. Inoltre, in occasione di eventi speciali o grandi manifestazioni in Svizzera sono organizzati cosiddetti event-harvesting: in questi casi sono collezionati e archiviati siti web che documentano un evento specifico (p. es. le Elezioni federali 2011). La BN rinuncia per il momento a un domain-harvesting (top-level-domain «.ch»). Partendo dai siti web selezionati, saranno realizzate istantanee possibilmente significative dello spazio web svizzero conservate per le generazioni future. I criteri di selezione sono descritti dettagliatamente nel pro-memoria sulla raccolta, anch'esso consultabile sul sito.
LA BIBLIOTECA NAZIONALE SVIZZERA PUÒ ARCHIVIARE IL MIO SITO WEB?
La Biblioteca nazionale svizzera ha il mandato legale di collezionare, inventariare, conservare, rendere accessibili e far conoscere gli stampati e gli altri supporti d'informazione che hanno un legame con la Svizzera. Vi rientrano le pubblicazioni digitali, tra cui e-book e siti web. La BN informa il gestore del sito web per posta (elettronica) dell'imminente harvesting. Il gestore del sito web ha così la possibilità di esprimersi in merito alla prevista archiviazione del suo sito.
CHE COSA LO DISTINGUE DA INTERNET ARCHIVE?
Internet Archive è un'organizzazione non profit fondata negli Stati Uniti nel 1996 con l'obiettivo di consentire ai ricercatori l'accesso in tutto il mondo alle collezioni digitali storiche. Nell'Archivio Web Svizzera sono collezionati e archiviati esclusivamente i siti web con il dominio «.ch» e siti web strettamente legati alla Svizzera.

L'ARCHIVIO WEB VIENE UTILIZZATO COMMERCIALMENTE?
L'archivio web comune della Biblioteca nazionale svizzera, delle biblioteche cantonali svizzere e di altre biblioteche specializzate è utilizzato a scopi scientifici e non commerciali. L'Archivio Web Svizzera è gratuitamente a disposizione dell'utenza nei locali della Biblioteca nazionale svizzera e delle biblioteche partner.

L'UTENZA POTREBBE CONFONDERE LA VERSIONE ARCHIVIATA CON L'ATTUALE VERSIONE DEL MIO SITO WEB?
L'accesso ai siti web è possibile solo nei locali della Biblioteca nazionale svizzera e delle biblioteche partner, non tramite Internet. Inoltre, le pagine archiviate sono chiaramente contrassegnate come tali. Confonderle è quindi pressoché impossibile.

A CHI MI DEVO RIVOLGERE PER OTTENERE MAGGIORI INFORMAZIONI SULL'ARCHIVIAZIONE WEB E SULL'ARCHIVIO WEB SVIZZERA?
Il coordinamento dell'Archivio Web Svizzera è sempre disponibile per domande, suggerimenti e critiche.
IN QUALITÀ DI GESTORE DI UN SITO WEB, COME POSSO DARE IL MIO SUPPORTO ALL'ARCHIVIO WEB SVIZZERA?
Lo scopo perseguito è quello di archiviare a intervalli regolari un'istantanea del sito web. Non sempre i siti web sono organizzati in modo da consentire la raccolta completa da parte dell'harvester. Una caratteristica importante dei siti web «crawler friendly» è quella di contenere link in formato HTML o XHTML, non inseriti in Flash o JavaScript. Risultano utili anche possibilità di navigazione alternative, con una versione solo testo o una mappa del sito. Se desiderate ricevere maggiori informazioni, non esitate a contattare il coordinamento dell'Archivio Web Svizzera.
QUALI MISURE ADOTTA LA BIBLIOTECA NAZIONALE SVIZZERA PER GARANTIRE CHE I SITI WEB SI POSSANO CONSULTARE ANCHE IN FUTURO?
Il modulo conservazione a lungo termine del modello di riferimento OAIS adottato dalla Biblioteca nazionale svizzera per l'archiviazione delle pubblicazioni elettroniche è ancora in fase di progettazione. Nell'ambito di questo progetto si stanno elaborando misure per preservare la leggibilità e l'interpretabilità delle informazioni elettroniche. Affinché la Biblioteca nazionale svizzera possa garantire piena leggibilità e interpretabilità in futuro, è necessario che nell'archiviazione delle pubblicazioni elettroniche si tenga conto, oltre che della preservazione delle informazioni stesse, anche dei supporti dati e degli ambienti di sistema.

Collezione

NELL'ARCHIVIO WEB SVIZZERA SI TROVANO TUTTI I SITI WEB SVIZZERI?
La Biblioteca nazionale svizzera ha deciso di procedere con un harvesting selettivo. La sfida che questo approccio inevitabilmente comporta è quella di individuare dei rappresentanti significativi all'interno dell'ampia offerta a disposizione. La collezione dell'Archivio Web Svizzera è composta principalmente da siti web rilevanti per la geografia e la storia della Svizzera. È compito delle biblioteche partner (le biblioteche cantonali svizzere e altre biblioteche specializzate) individuare una selezione ragionata e rappresentativa dell'offerta dei loro Cantoni e dei loro settori specifici. La selezione è effettuata sulla base di direttive di raccolta fissate di comune accordo (promemoria «Raccolta»).
CHI EFFETTUA LA SELEZIONE DEI SITI WEB?
La selezione dei siti web è decisa dalle biblioteche partner dell'Archivio Web Svizzera, vale a dire dalle biblioteche cantonali svizzere e da altre biblioteche specializzate. La selezione è effettuata sulla base di direttive di raccolta fissate di comune accordo.
SE REALIZZO UN NUOVO SITO WEB POSSO SEGNALARLO PER L'ARCHIVIAZIONE?
Solo le biblioteche partner (le biblioteche cantonali svizzere e altre biblioteche specializzate) possono selezionare e segnalare siti web per la collezione dell'Archivio Web Svizzera. È possibile inoltre segnalare l'URL del sito al coordinamento di Archivio Web Svizzera della Biblioteca nazionale svizzera. Il coordinamento trasmetterà la proposta alla biblioteca partner competente. Se includere o meno il sito web nell'harvesting è deciso sulla base dei criteri di raccolta.
IL MIO SITO WEB DISPONE DI UN'AREA PROTETTA DA PASSWORD. VIENE ARCHIVIATA ANCHE QUESTA?
Nell'Archivio Web Svizzera sono raccolti e archiviati solo i siti web pubblicati e accessibili. Non sono archiviati per esempio i siti intranet o dati privati con accesso protetto.

Raccolta e archiviazione

COME AVVIENE L'ARCHIVIAZIONE DEL WEB? QUALE SOFTWARE VIENE UTILIZZATO?
La Biblioteca nazionale svizzera utilizza per l'harvesting Heritrix, il software open source più diffuso al mondo per l'archiviazione del web. Il software open source PhantomJS supporta inoltre il crawler nel localizzare tutti i link rilevanti. Il crawler Heritrix segue i link all'interno di un sito web e raccoglie tutti i dati trovati. Le pagine protette da una password non possono essere raccolte. L'obiettivo consiste nello scaricare una versione più completa e corretta possibile del sito web. Le pagine protette da password o link a pagine esterne non sono raccolti. L'accesso al sito raccolto avviene tramite way-back machine.

RACCOGLIERE E ARCHIVIARE SITI WEB È SEMPLICE OPPURE VI SONO LIMITAZIONI TECNICHE?
L'archiviazione del web è ancora agli esordi. È possibile che un sito web, pur adempiendo i criteri di Archivio Web Svizzera, non sia archiviabile per ragioni tecniche. Considerato che i tool miglioreranno ulteriormente, migliorerà gradualmente anche la qualità dei crawl. Essendo la Biblioteca nazionale svizzera membro dell'IIPC (International Internet Preservation Consortium), è in costante contatto con altre istituzioni della memoria in tutto il mondo impegnate nell'archiviazione del web.

PERCHÉ ALCUNI SITI WEB SONO PIÙ DIFFICILI DA ARCHIVIARE DI ALTRI?
Grandi quantità di dati, contenuti o funzioni di menu mancanti, animazioni flash, funzioni dinamiche basate su script, crawler trap come i calendari o le mappe topografiche possono complicare il processo di archiviazione. È il personale delle biblioteche a decidere se registrare o non registrare un determinato sito web. In un secondo momento si cercherà di ottenere un'istantanea di qualità migliore. Tuttavia i siti web possono essere archiviati anche nonostante eventuali difetti qualitativi, così da averne per lo meno un'attestazione. In alcuni casi, inoltre, l'incorretta riproduzione grafica di un sito web può essere dovuta alle carenze della versione attuale di Wayback Machine. Per questo motivo, nella misura del possibile si utilizza sempre la versione più recente degli strumenti per l'archiviazione del web.

Archives Web Suisse : glossaire, version 1.6, 5 février 2016 (in francese) (PDF, 188 kB, 09.02.2016)Il glossario contiene il vocabolario professionale e le abbreviazioni utilizzate nei documenti di Archivio Web Svizzera.

PERCHÉ HO RICEVUTO UN MESSAGGIO RIGUARDANTE L'ARCHIVIAZIONE DEL MIO SITO WEB?
La Biblioteca nazionale svizzera invia questo messaggio a tutti i gestori di siti web i cui siti sono stati selezionati per l'Archivio Web Svizzera. Vi figurano gli obiettivi dell'Archivio Web Svizzera, la procedura di harvesting e il servizio da contattare in caso di domande supplementari. Non è necessario reagire, a meno che non si desideri rifiutare l'archiviazione del proprio sito web.

CON CHE FREQUENZA LA BIBLIOTECA NAZIONALE SVIZZERA RACCOGLIE SITI WEB?
In genere, il sito web è raccolto una volta all'anno. Altri possibili intervalli di raccolta dei dati sono: un'unica volta, ogni quattro anni, ogni due anni e ogni sei mesi. La frequenza di raccolta dei dati dipende in larga misura dai contenuti dei siti e può essere stabilita individualmente per ciascun sito. Nel caso di raccolte speciali è determinante il risultato e la frequenza è adeguata di conseguenza.

DEVO PREPARARE IL MIO SITO WEB PER L'ARCHIVIAZIONE? CHE COSA DEVO PREDISPORRE?
Per l'archiviazione del web non è necessario alcun preparativo da parte del gestore del sito. Non è neppure necessario l'aggiornamento del sito web prima dell'harvesting. Un sito selezionato è di solito raccolto regolarmente (p. es. una volta l'anno). In questo modo è possibile documentare come cambia un sito nel corso degli anni.
IN CHE MISURA IL CRAWLER SOLLECITA IL MIO SERVER?
Il web crawler della Biblioteca nazionale svizzera è configurato in modo da ridurre al minimo il sollecitamento del server. Se dovessero comunque sorgere dei problemi di ordine tecnico a causa dell'harvesting, vi preghiamo di contattare il coordinamento dell'Archivio Web Svizzera.
PERCHÉ IL CRAWLER IGNORA ROBOTS.TXT E META-TAG ROBOTS?
Se durante l'harvesting robots.txt e robots-meta-tags venissero presi in considerazione, il sito web raccolto potrebbe non essere riprodotto integralmente e quindi non riprodotto correttamente. Per evitarlo robots.txt e robots-meta-tags vengono ignorati.

Archives Web Suisse : glossaire, version 1.6, 5 février 2016 (in francese) (PDF, 188 kB, 09.02.2016)Il glossario contiene il vocabolario professionale e le abbreviazioni utilizzate nei documenti di Archivio Web Svizzera.

L'ARCHIVIAZIONE DEL MIO SITO WEB MI VIENE ADDEBITATA?
L'archiviazione è gratuita per i gestori di siti web.

COME DEVO PROCEDERE SE NON VOGLIO CHE LA BIBLIOTECA NAZIONALE SVIZZERA ARCHIVI IL MIO SITO WEB?
Il gestore di un sito web che ha ricevuto dalla Biblioteca nazionale svizzera una comunicazione concernente un'imminente raccolta e archiviazione del proprio sito web, può rivolgersi al coordinamento dell'Archivio Web Svizzera per comunicare le sue esigenze. L'harvesting sarà quindi interrotto o non lanciato. Per la Biblioteca nazionale svizzera, le biblioteche partner e i futuri ricercatori è importante che venga raccolto e archiviato il maggior numero possibile di siti web con riferimento alla Svizzera. Solo in questo modo l'utilità scientifica dell'archivio web potrà essere garantito a lungo termine.
CHE OPERAZIONI VENGONO ESEGUITE SUI SITI WEB DOPO CHE L'HARVESTER LI HA RACCOLTI?
Dopo l'harvesting viene controllata la qualità del processo di raccolta. La Biblioteca nazionale svizzera colloca i siti web raccolti in un ambiente web chiuso e vi accede per eseguire sistematicamente delle verifiche manuali. Se la qualità viene ritenuta sufficiente, si prosegue con l'archiviazione, mentre se risulta insufficiente si ripete l'harvesting con impostazioni diverse.
COME VENGONO SALVATI E CONSERVATI I SITI WEB SEGNALATI?
Il sistema Ingest prepara i dati per l'archiviazione e garantisce che i rispettivi metadati siano disponibili nel catalogo della Biblioteca nazionale svizzera (Helveticat). I siti web vengono memorizzati nell'archivio di lunga durata insieme ai metadati. Nell'archivio di lunga durata non è possibile sovrascrivere o cancellare le informazioni registrate. I dati vengono protetti mediante copie di backup conservate in due sedi diverse a Berna. Un processo automatizzato di raffronto assicura la completezza dei dati salvati in entrambe le sedi. Presso la sede secondaria, inoltre, viene creata una terza copia dei dati su nastro magnetico per mezzo di un'unità a nastro IBM. Questa terza copia viene conservata separatamente.
LA BIBLIOTECA NAZIONALE SVIZZERA ASSUME ANCHE L'HOSTING?
No, i gestori dei siti web rimangono responsabili dell'hosting dei loro siti. L'harvesting effettuato regolarmente genera solo istantanee di un sito archiviate singolarmente che in seguito possono essere utilizzate per scopi scientifici.

Consultazione

POSSO TROVARE IL MIO SITO WEB NEL CATALOGO HELVETICAT?
Con l'archiviazione del sito web viene effettuata anche una registrazione nel catalogo Helveticat della Biblioteca nazionale svizzera. Tutti i siti web archiviati sono registrati e reperibili in Helveticat. Un link collega direttamente alle collezioni digitali (e-Helvetica Access). Il sito non viene registrato in «Il Libro svizzero», bibliografia nazionale della Biblioteca nazionale svizzera.
COME POSSO ACCEDERE AI DATI ARCHIVIATI?
I siti web archiviati sono ricercabili e consultabili in e-Helvetica Access, il sistema di accesso alle collezioni digitali. Per ragioni legali, l'accesso all'archivio web è possibile unicamente nelle sale pubbliche della Biblioteca nazionale svizzera oppure nelle sale pubbliche delle biblioteche partner.
QUAL È LA DIFFERENZA TRA HELVETICAT E E-HELVETICA ACCESS?
Helveticat è il catalogo online della Biblioteca nazionale svizzera in cui sono registrate pubblicazioni sia cartacee che digitali.
 
e-Helvetica Access è il sistema di accesso alle collezioni digitali della Biblioteca nazionale svizzera. Oltre a siti web vi sono registrati e-book, e-journals, pubblicazioni universitarie e pubblicazioni ufficiali digitali nonché documenti cartacei digitalizzati in un secondo tempo.

COME POSSO EFFETTUARE UNA RICERCA DI SITI WEB?I
siti web possono essere ricercati nel catalogo online Helveticat o utilizzando il sistema di accesso alle collezioni digitali e-Helvetica
Access.
In Helveticat si può effettuare una ricerca specifica utilizzando un codice di estrazione, un URL, impostando un filtro di ricerca per lingua di pubblicazione o tramite classificazione decimale Dewey. La procedura di ricerca dettagliata è disponibile nelle istruzioni per la ricerca di siti web. e-Helvetica Access offre una funzione di ricerca apposita per i siti web (ricerca archivio web). Ulteriori informazioni sulle singole ricerche sono disponibili nei documenti di riferimento (indicati col simbolo del salvagente) di e-Helvetica Access.

PERCHÉ NON POSSO VISUALIZZARE DA CASA IL SITO WEB ARCHIVIATO?
La disponibilità dei siti web dipende dalle condizioni quadro giuridiche. I siti web sono protetti da diritti d'autore e si possono visualizzare soltanto nelle sale aperte al pubblico della Biblioteca nazionale svizzera.

POSSO STAMPARE DEI SITI WEB?
Per motivi legati ai diritti d'autore è necessario limitare l'accesso alle istantanee archiviate. Pertanto non è ammessa alcuna forma di riproduzione come il salvataggio, la stampa, ecc.

PERCHÉ LA BIBLIOTECA NAZIONALE SVIZZERA INSERISCE IL MIO SITO WEB IN UNA COLLEZIONE? DOPOTUTTO C'È ANCHE GOOGLE.
La Biblioteca nazionale svizzera ha il mandato legale di collezionare le pubblicazioni elettroniche che trattano temi inerenti alla Svizzera. Lo scopo dell'Archivio Web Svizzera non è quello di offrire un'ulteriore possibilità di accesso alle informazioni attualmente riportate sul vostro sito web, bensì di documentare l'evoluzione dei siti web negli anni e nei decenni: per esempio, nel 2025 consentirebbe di accedere al vostro sito web così come si presentava nel 2015. A questo scopo raccogliamo periodicamente una «copia» di tutti i siti web selezionati. Queste copie consentono di osservare i cambiamenti dei siti web nel tempo.

QUALI SONO I VANTAGGI PER IL MIO COMUNE SE IL NOSTRO SITO WEB VIENE ARCHIVIATO DALLA BIBLIOTECA NAZIONALE SVIZZERA?
In virtù del suo mandato legale, la Biblioteca nazionale svizzera si è posta l'obiettivo di sviluppare una collezione selettiva di siti web rilevanti per la geografia e la storia della Svizzera. Con il vostro consenso a registrare il sito web nell'Archivio Web Svizzera contribuite allo sviluppo di un'interessante collezione utile per fini di ricerca storica. L'istantanea del vostro sito web, inoltre, viene archiviata a lungo termine senza che ciò comporti per voi alcun tipo di lavoro o costo. Nel corso del tempo sarà così possibile documentare le variazioni dei contenuti e dell'impostazione grafica.

Contatto

Biblioteca nazionale svizzera
e-Helvetica
Coordinamento di Archivio Web Svizzera
Svizzera
E-mail

Stampare contatto

https://www.nb.admin.ch/content/snl/it/home/bn-professionale/e-helvetica/informazioni-per-i-fornitori/siti-web-_-archivio-web-svizzera/faq-sull_archiviazione-web.html