Archiviazione

Il processo d'archiviazione si compone di due elementi. Da una parte vi è il sistema Ingest, che prepara i dati per l'archiviazione ed assicura che i metadati che li accompagnano siano altresì messi a disposizione. Dall'altra vi è il sistema d'archiviazione vero e proprio (la memoria), nel quale sono stoccati i dati (le pubblicazioni elettroniche) con i relativi metadati. E' importante che i metadati vengano pure repertoriati in un catalogo accessibile all'utenza.

OAIS

Per la realizzazione del sistema d'archiviazione per le informazioni elettroniche la Biblioteca nazionale svizzera segue il modello di riferimento per un sistema d'archiviazione delle informazioni aperto, elaborato dal Consultative Committee for Space Data Systems.

Ingest

Viene denominato Ingest il processo che va dalla presa a carico dei dati del fornitore, rispettivamente dei dati accessibili in Internet, fino al loro deposito nel sistema d'archiviazione.

Harvesting

Il termine Harvesting designa la raccolta di siti web presenti in Internet. Partendo da uno o più documenti uno speciale programma va alla ricerca di tutti i documenti raggiungibili grazie ad un link contenuto in una di queste pagine. In seguito esso segue anche i link contenuti nei documenti ritrovati fino a che tutti i documenti appartenenti ad un dominio predefinito siano stati raccolti.

Garanzia della qualità

Una seria garanzia della qualità dei siti web è possibile unicamente con l'ausilio di uno strumento tecnico in grado di analizzare nel dettaglio i documenti raccolti e di segnalarne gli eventuali errori. Lo sviluppo di tale strumento è previsto nell'ambito di IIPC (International Internet Preservation Consortium). Fino a quando esso non sarà pronto per l'uso, la garanzia della qualità deve inevitabilmente venir effettuato manualmente; per questa ragione esso è attualmente assai rudimentale.
Va detto che la garanzia della qualità non ha lo scopo di controllare la qualità dei siti web presenti in Internet, ma la qualità del processo di raccolta.
Per ora la BN deposita i siti web raccolti in un ambiente web chiuso al quale accede per effettuare dei controlli sistematici.
Il processo di gestione della qualità è descritto nel promemoria sull’archiviazione nell’ambito dell'Archivio Web Svizzera.

Metadati

La BN ha scelto di non sviluppare una struttura di metadati propria, ma di usare dei formati XML esistenti. Essa non deve quindi adoperarsi nello sviluppo di tale struttura. Per la struttura interna dei metadati la BN utilizza il contenitore per dati bibliografici METS, nel quale è integrato MARCXML. METS e MARCXML vengono costantemente aggiornati dalla Library of Congress. MARCXML è compatibile con MARC21, la struttura dei metadati di Helveticat. Nello schema «Preservation Metadata», sviluppato dalla National Library of New Zealand, i metadati non bibliografici (tecnici ed amministrativi) vengono pure integrati nel contenitore METS.

Persistent identifier

Un persistent identifier (identificatore univoco) deve rispondere a due necessità:
- identificazione univoca dei documenti d'archivio
- rinvio stabile ad una fonte di dati online (i normali link si sono in questo senso rivelati piuttosto inaffidabili).
La BN ha deciso di utilizzare degli Uniform Resource Name (URN) sotto forma di National Bibliography Number (NBN) poiché gli URN rispondono alle esigenze citate. Grazie alla sua collaborazione con la Deutsche Nationalbibliothek (DNB) la BN può avvalersi dell'URN resolver della DNB per trasformare gli URN in link.

Stoccaggio dei dati

In precedenza, l’infrastruttura per l’archiviazione digitale si componeva di due robot a nastro magnetico. All’inizio del 2009 questa infrastruttura è stata sostituita la memoria a lungo termine Ninive. Essenzialmente questa memoria consiste in un sistema NAS ridondante (Network Attached Storage) dell’azienda NetWork Appliance. Le due componenti sistemiche con spazio di memoria di 9 TB ciascuna, sono entrambe ubicate a Berna e distano circa 4,5 km l’una dall’altra. Una sincronizzazione automatizzata di dati tra le due componenti del sistema permette di conservare in modo completo i dati in entrambe le ubicazioni. All’ubicazione secondaria viene effettuata una terza copia dei dati su nastro magnetico tramite dispositivo di trascinamento del nastro magnetico IBM. Questa terza copia viene conservata separatamente.

Informazioni complementari

Archives Web Suisse : notice Archivage, version 1.6, 30 janvier 2015 (in francese) (PDF, 1 MB, 09.02.2016)Il promemoria descrive come le biblioteche cantonali gestiscono e conservano i siti web annunciati. Sono descritte le tappe successive del processo: il download (harvesting), la gestione della qualità, il trattamento dei metadati, l’assegnazione di un URN e lo stoccaggio dei dati.


Links

Ultima modifica 09.02.2016

Inizio pagina

https://www.nb.admin.ch/content/snl/it/home/bn-professionale/e-helvetica/informazioni-per-gli-addetti-ai-lavori/archiviazione.html