La Biblioteca nazionale svizzera (BN) ha il mandato legale di collezionare e conservare supporti d’informazione relativi alla Svizzera e di mettere tale sapere a disposizione delle generazioni future. I siti web rientrano in questa categoria; oggi infatti molte informazioni non vengono più stampate ma pubblicate su Internet.
Per l’archiviazione web la BN si avvale della collaborazione di altre istituzioni della memoria svizzere. Le biblioteche cantonali, ulteriori biblioteche e archivi specializzati sono partner della BN. L’elenco completo è consultabile nel documento di base (disponibile in francese o tedesco) dell’Archivio Web Svizzera.
Archives Web Suisse: Bases, 03.07.2024 (in francese) (PDF, 264 kB, 04.07.2024)Il documento di base descrive l'origine, lo sviluppo, il contenuto, gli obiettivi, le tappe di lavoro e l'organizzazione di Archivio Web Svizzera.
La BN non fa crawls di tutti i domini (Domaincrawls) e quindi non salva automaticamente ogni sito web con il dominio «.ch». Per un procedimento di questo tipo manca la base legale: in Svizzera non esiste infatti una legge sul deposito legale valida a livello nazionale per i media online. La BN segue quindi un approccio selettivo.
Internet Archive è un'organizzazione non profit fondata a San Francisco nel 1996 che archivia una selezione di siti web a livello mondiale e li mette a libera disposizione tramite Wayback Machine. L’Archivio Web Svizzera si concentra invece sulla documentazione di contenuti web strettamente legati alla Svizzera, indipendentemente dal fatto se il loro dominio sia «.ch» o no.
La sfida che comporta l’approccio selettivo è quella di individuare una selezione ragionata e rappresentativa all’interno dell’ampia offerta a disposizione. La selezione dei siti web è decisa dai partner dell’Archivio Web Svizzera, vale a dire dalle biblioteche cantonali svizzere, da ulteriori biblioteche e archivi specializzati e dalla BN stessa. Ogni istituzione contribuisce alla raccolta con le conoscenze ed esperienze specifiche del proprio ambito.
I siti web devono essere liberamente accessibili ed essere strettamente legati alla Svizzera. I criteri di selezione sono descritti dettagliatamente nel documento esplicativo «Collecte» (disponibile in francese o tedesco).
Archives Web Suisse: Notice Collecte, version 2.4, 23.07.2024 (in francese) (PDF, 1 MB, 07.08.2024)Il documento esplicativo «Collecte» contiene le basi per la costituzione di una collezione di siti web d'importanza patrimoniale, ne definisce gli ambiti di collezione ed i criteri di selezione.
Potete segnalare tramite e-mail il vostro sito web al coordinamento dell’Archivio Web Svizzera, che esaminerà la vostra proposta e deciderà se includere il vostro sito web nella raccolta sulla base di criteri specifici.
Per copiare i siti web, la BN utilizza il crawler Heritrix, un software open source, supportato dal software open source PhantomJS nella localizzazione di tutti i link rilevanti. Il crawler Heritrix segue i link all’interno di un sito web, raccoglie tutti i file trovati e li copia sul server della BN. L’obiettivo consiste nello scaricare una versione più completa e corretta possibile del sito web. Le pagine protette da password o link a pagine esterne non vengono raccolti. Per una descrizione dettagliata di questo procedimento, è possibile consultare il documento esplicativo «Archivage» (disponibile in francese o tedesco).
Archives Web Suisse: Notice Archivage, version 1.7, 19.04.2024 (in francese) (PDF, 1 MB, 22.04.2024)Il documento esplicativo «Archivage» descrive come i siti web annunciati dalle istituzioni partner sono gestiti e conservati nel sistema della BN. Sono descritte, per esempio, le tappe successive del processo: il download (harvesting), la gestione della qualità e lo stoccaggio dei dati.
In genere, il sito web è copiato ogni 2 anni. Altri possibili intervalli di raccolta dei dati sono: una tantum o ogni 4 anni. La frequenza di raccolta dei dati dipende in larga misura dai contenuti e può essere stabilita individualmente per ciascun sito.
La BN invia questa comunicazione a tutti i titolari di siti web selezionati per l’Archivio Web Svizzera. La comunicazione contiene indicazioni sull’obiettivo, sul procedimento di archiviazione e sulla messa a disposizione. Non è obbligatorio reagire, a meno che non si desideri rifiutare l’archiviazione del proprio sito web.
L’archiviazione è gratuita.
No, i titolari di siti web rimangono responsabili dell’hosting dei loro siti. L’archiviazione periodica genera solo istantanee di un sito archiviate singolarmente e utilizzate in seguito per scopi scientifici.
Per l’archiviazione del sito web non è necessario alcun preparativo. Non è neppure necessario aggiornare il sito web prima dell’archiviazione. Un sito selezionato è di solito raccolto regolarmente (ogni 2 anni). In questo modo è possibile documentare come cambia un sito nel corso degli anni.
Il crawler della BN è configurato in modo da sollecitare il server il meno possibile. Se dovessero comunque sorgere dei problemi di ordine tecnico a causa dell’archiviazione, vi preghiamo di contattare il coordinamento dell’Archivio Web Svizzera. Su richiesta è possibile rallentare la velocità del crawler.
Aree protette, per esempio i siti intranet o dati privati con accesso protetto non vengono archiviati dal crawler. Nell’Archivio Web Svizzera sono raccolti e archiviati solo contenuti pubblicati in Internet e liberamente accessibili.
Se durante l’archiviazione venissero presi in considerazione anche file robots.txt e meta tag robots, il sito web raccolto potrebbe non essere copiato integralmente e riprodotto correttamente. Per evitarlo, i file robots.txt e meta tag robots vengono ignorati.
È possibile che un sito web non venga archiviato per motivi tecnici, nonostante soddisfi i criteri di raccolta dell’Archivio Web Svizzera.
Grandi quantità di dati, contenuti o funzioni di menu mancanti, animazioni flash, funzioni dinamiche basate su script, crawler trap come i calendari o le mappe topografiche possono complicare il processo di archiviazione. Tuttavia alcuni siti web sono archiviati nonostante eventuali difetti qualitativi, così da averne per lo meno un’attestazione. In alcuni casi, inoltre, l’incorretta riproduzione grafica di un sito web può essere dovuta alle carenze dello strumento di visualizzazione, ad es. di Wayback Machine.
Una caratteristica importante dei siti web «crawler friendly» è quella di contenere link in formato HTML o XHTML, non inseriti in Flash o JavaScript. Risultano utili anche possibilità di navigazione alternative, con una versione solo testo o una mappa del sito. Se desiderate ricevere maggiori informazioni, non esitate a contattare il coordinamento dell’Archivio Web Svizzera.
I titolari di un sito web che hanno ricevuto dalla BN una comunicazione concernente un’imminente raccolta e archiviazione del loro sito web, possono rivolgersi al coordinamento dell’Archivio Web Svizzera per comunicare le proprie esigenze.
I siti web archiviati sono ricercabili e consultabili inserendo il testo integrale su e-Helvetica Access, il portale di accesso alle collezioni digitali. Per motivi di diritti d’autore, l’accesso all’Archivio Web è possibile solo nei locali della BN e delle istituzioni partner. Non è ammessa alcuna forma di riproduzione dei siti come il salvataggio, la stampa, ecc.
L’Archivio Web Svizzera è utilizzato a fini storico-scientifici e i siti web archiviati non vengono usati per scopi commerciali. L’Archivio Web Svizzera è messo gratuitamente a disposizione dell’utenza nei locali della BN e delle istituzioni partner.
Il coordinamento dell’Archivio web Svizzera è a vostra disposizione per ulteriori informazioni.