Logo des MDZ: Münchener DigitalisierungsZentrum, Digitale Bibliothek. Zur Startseite

Langzeitarchivierung und Data Curation

Digitale Langzeitarchivierung an der BSB

Für die Bayerische Staatsbibliothek als Landes- und Archivbibliothek ist die Sicherung der Langzeitverfügbarkeit und -nutzbarkeit ihrer digitalen Bestände ein zentraler Teil ihres Gesamtauftrags. Zum digitalen Bestand zählen neben den Retro-Digitalisaten von Kulturgütern auch genuin elektronische Publikationen. Diese umfassen die Publikationen aus der eigenen Produktion, Ablieferungen elektronischer Monographien und Zeitschriften Bayerischer Behörden, wissenschaftlich relevante Open Access Publikationen zu den Sammelschwerpunkten der BSB und zu Bavarica sowie Webarchive. Die Strategie der Langzeitarchivierung der Bayerischen Staatsbibliothek (PDF) wurde in einer ausführlichen Policy beschrieben.

Das Aufgabengebiet der Langzeitarchivierung stellt die in diesem Feld aktiven Institutionen laufend vor neue Herausforderungen. Die BSB beteiligt sich daher im Rahmen von Forschungsprojekten an der Entwicklung von innovativen Konzepten und Lösungen, durch Mitarbeit im DIN an der Standardisierung sowie als Partner im deutschen Kompetenznetzwerk nestor an der Vernetzung, dem Austausch, der Qualifizierung und Zertifizierung.

Informationen zu früheren Projekten finden sich in unserem Webarchiv Langzeitarchivierung an der Bayerischen Staatsbibliothek .

Aufgaben der Langzeitarchivierung

Der rasche technologische Wandel in Hard- und Software, insbesondere bei Datenträgern und bei Datei- und Datenformaten, sowie die Flüchtigkeit der Ressourcen im World Wide Web können die Verfügbarkeit und Nutzbarkeit digitaler Ressourcen gefährden. Diesen Risiken gilt es mit entsprechenden organisatorischen, technischen und bibliothekarischen Maßnahmen entgegenzuwirken.

Zu den Aufgaben der Langzeitarchivierung zählen:

  1. Identifikation und Spezifikation von wenigen langzeittauglichen Dateiformaten für die verschiedenen Materialtypen

  2. Vergabe von Persistenten Identifikatoren wie etwa Uniform Ressource Names (URNs) zur Sicherung des Zugriffs auf die elektronischen Ressourcen

  3. Qualitätsprüfung und Validierung der digitalen Objekte vor der Archivierung

  4. Sichere Verwaltung und Speicherung auf unterschiedlichen Speichermedien und an unterschiedlichen Orten

  5. Dokumentation aller Veränderungen an den Objekten und Metadaten im Lebenszyklus der digitalen Objekte

  6. Risikobewertung und Einleitung von Langzeitarchivierungsmaßnahmen bei Bedarf, z.B. die Migration in ein aktuelleres Datenformat

Die technische Infrastruktur des digitalen Langzeitarchivs der BSB, aufbauend auf dem Langzeitarchivsystem Rosetta der Firma Ex Libris/Proquest, unterstützt diese Aufgaben.

Ablieferung und Langzeitarchivierung von Netzpublikationen

Die Bayerische Staatsbibliothek ist die zentrale Landes- und Archivbibliothek des Freistaates Bayern. Zu den landesweiten Diensten der BSB in diesem Bereich siehe auch die Informationen der Pflichtstelle und der Amtlichen Veröffentlichungen auf der Webseite der Bayerischen Staatsbibliothek.

Gemäß der Bekanntmachung der Bayerischen Staatsregierung vom 2. Dezember 2008 (Az.: B II 2-480-30) (PDF) zur Abgabe amtlicher Veröffentlichungen an Bibliotheken haben alle Behörden, Dienststellen und Einrichtungen des Freistaates Bayern auch ihre elektronischen Publikationen (Netzpublikationen) an die Bayerische Staatsbibliothek abzugeben. Amtliche Publikationen in elektronischer Form werden dauerhaft gespeichert und für die Benutzung zur Verfügung gestellt, sofern der Herausgeber dies nicht eingeschränkt oder untersagt hat. Für amtliche Netzpublikationen hat die BSB das webbasierte Verfahren zur Ablieferung "Deposit" eingerichtet, über das Publikationen einfach und bequem durch Mitarbeiter und Mitarbeiterinnen der abliefernden Stellen selbstständig hochgeladen werden können. Die Bayerische Staatsbibliothek macht alle Netzpublikationen über ihren Katalog auffindbar und stellt sie in der Regel frei zur Verfügung. Darüber hinaus baut die BSB für ihre fachlichen Schwerpunkte (Bavarica, Musik, Osteuropa, Altertumswissenschaften und Geschichte) Sammlungen von Netzpublikationen auf, die auch der Langzeitarchivierung zugeführt werden, sofern die Archivierungs- und Nutzungsrechte entsprechend erteilt wurden.

Weitere Hinweise zur Ablieferung von Netzpublikationen finden Sie in unseren FAQ. Bei Fragen nehmen Sie bitte Kontakt zu uns auf.

Webarchivierung

Gesellschaftliches, politisches, soziales, kulturelles und wissenschaftliches Handeln manifestiert sich heute zu großen Teilen im Internet und den dort etablierten Sozialen Medien. Um den Erhalt dieses digitalen Kulturerbes und die Kontinuität der wissenschaftlichen Informationsversorgung im Web auch für nachfolgende Generationen zu sichern, werden von Institutionen weltweit Websites systematisch gesammelt, erschlossen und archiviert. Im Rahmen ihrer landesweiten Aufgaben sowie ihrer inhaltlichen Sammelschwerpunkte (Bavarica, Musik, Osteuropa, Altertumswissenschaften, Geschichte) archiviert die BSB seit 2012 Websites und macht sie für Wissenschaft und Forschung dauerhaft öffentlich zugänglich. Aus rechtlichen Gründen nimmt die BSB nur Websites in ihre Sammlung auf, für die eine explizite Archivierungs- und Nutzungsbewilligung vorliegt oder die gemäß der Bekanntmachung der Bayerischen Staatsregierung vom 2. Dezember 2008 (Az.: B II 2-480-30) (PDF) zur Abgabe amtlicher Veröffentlichungen an Bibliotheken als elektronische amtliche Veröffentlichungen von der BSB dauerhaft zu speichern und zugänglich zu machen sind.

Für die Archivierung kommt das Web Curator Tool zum Einsatz. Diese Open-Source-Software bietet einen integrierten Bearbeitungsprozess von der Genehmigungseinholung über den automatisierten Harvest-Prozess sowie die intellektuelle Qualitätskontrolle bis hin zur Archivierung. Der integrierte Crawler „Heritrix“ folgt beim Harvest-Prozess der Linkstruktur auf den Websites und sammelt die gefundenen Seiten ein. Externe Links auf andere Angebote und passwortgeschützte Bereiche der Website werden dabei nicht weiter verfolgt. Dieses Verfahren wird regelmäßig in halbjährlichem Abstand wiederholt, sodass eine Website in mehreren Zeitschnitten, die den Stand zum jeweiligen Zeitpunkt wiedergeben, archiviert wird. Die Langzeitarchivierung erfolgt im System Rosetta von Ex Libris/ProQuest. Die Bayerische Staatsbibliothek macht alle archivierten Websites über ihren Katalog auffindbar und öffentlich zugänglich (Beispiel für ein Webarchiv im OPACplus). Der Nutzer erhält im Viewer Wayback zunächst eine chronologische Übersicht aller im Archiv vorhandenen Zeitschnitte einer Website, die er dann gezielt einzeln aufrufen kann. Die Webarchive stehen auch in den fachspezifischen Informationsportalen und der bayerischen Bibliographie für wissenschaftliche Recherchen zur Verfügung.

Weitere Hinweise zur Webarchivierung finden Sie in unseren FAQ. Bei Fragen nehmen Sie bitte Kontakt zu uns auf.

Data Curation

Für die BSB als multimedialer Informationsdienstleister für die Wissenschaft ist ein nachhaltiges Management digitaler Ressourcen (Inhalts- wie Metadaten) besonders wichtig. Die Qualitätsmerkmale von digitalen Ressourcen sind im Hinblick auf heutige wie zukünftige Anforderungen der Zielgruppen zu spezifizieren. Es gilt die Qualität der digitalen Ressourcen im gesamten Lebenszyklus zu sichern.

Die Aufgaben von Data Curation umfassen

  • Identifizierung von qualitätsvollen, archivfähigen Daten- und Dateiformaten für unterschiedliche Medientypen

  • Erstellung von eigenen Policies, die die spezifischen Qualitätsanforderungen berücksichtigen

  • Einsatz von Tools zur Validierung von Daten und Überprüfung der Qualitätsanforderungen

  • Einsatz geeigneter Metadaten zur Sicherung der Integrität und Authentizität sowie der Qualität der Daten im gesamten Lebenszyklus

  • Nachhaltiges Management der Speicherinfrastrukturen

  • Langzeitarchivierung

  • Beratung der anderen Abteilungen des Hauses bei Fragen zu Qualität von digitalen Ressourcen, Archivfähigkeit von Daten- und Dateiformaten