Navigation und Service

OAI im Überblick

OAI (Open Archives Initiative) ist eine Initiative, die die Definition einer offenen Schnittstelle zum Austausch von Metadaten zum Ziel hat. Die Kommunikation einer solchen Schnittstelle erfolgt zwischen der Deutschen Nationalbibliothek als Datenlieferant (data provider) und einem Dienstanbieter (service provider), der die Daten bezieht. Der Bezug erfolgt automatisiert durch einen sogenannten „OAI-Harvester“. Das Protokoll, welches für die Kommunikation verwendet wird, hat die Bezeichnung OAI-PMH (OAI-Protocol for Metadata Harvesting). OAI ermöglicht eine ständige Synchronisation großer Datenbestände, dies setzt den Datenimport eines aktuellen Grundbestandes in eine eigene Datenbank voraus.
Nach Anmeldung und Autorisierung bietet die Deutsche Nationalbibliothek über eine HTTP- oder HTTPS-Schnittstelle und das OAI-PMH-Protokoll eine Anfragemöglichkeit auf ihre Daten.

OAI - Häufig gestellte Fragen (FAQ) / Fehlerbehebung

Standard der OAI-Schnittstelle

Protokoll: OAI-PMH Version 2.0

OAI-PMH Protokoll

Das Protokoll OAI-PMH ist webbasiert. Der OAI-Harvester arbeitet mit einfachen Anfragen per HTTP-GET oder -POST und erhält eine HTTP-Antwort vom Datenlieferanten zurück. Diese Antwort enthält, eingebettet in eine XML-Struktur, die angeforderten Metadaten. Ein Vorzug dabei ist, dass ein OAI-Repository auch mit einem Webbrowser abgefragt werden kann.

OAI-Harvester

Um OAI zum Abgleich der Daten zwischen der Deutschen Nationalbibliothek und einem Dienstanbieter nutzen zu können, muss auf Seiten des Dienstanbieters ein OAI-Harvester (z. B. OAI-PMH Harvester Manager) implementiert werden. Der OAI-Harvester ruft sich in einer Endlosschleife immer wieder selbst auf. Er führt dabei einen „ListRecords-Befehl“ aus, der sich auf das für den Dienstanbieter definierte Datenset (Katalog) beschränkt. Desweiteren wird dem „ListRecords-Befehl“ über einen Zeitstempel, der Zeitpunkt des letztmaligen Aufrufs mitgegeben. Auf diese Weise ist gewährleistet, dass

  • keine Änderung verpasst wird
  • sich Änderungen zeitnah in der Dienstanbieter-Datenbank widerspiegeln
  • keine für den Service Provider irrelevanten Daten transportiert werden

OAI-Funktionen

Das Protokoll OAI-PMH enthält sechs Basisfunktionen, die an die baseURL (z. B. "http://services.dnb.de/oai/repository") mit "?verb=" angefügt werden:

  • Identify: Anzeige von allgemeinen Informationen zum OAI-Repository, z. B.

    • repositoryName
    • baseURL
    • protocolVersion

  • ListSets: Informationen zu allen im OAI-Repository zur Verfügung stehenden Datensets (Kataloge)

  • ListMetadataFormats: Auflistung aller im OAI-Repository zur Verfügung stehenden Datenformate

  • GetRecord: Abruf einzelner Datensätze mittels ID-Angabe. Voraussetzung ist die Kenntnis der Identifikationsnummer des gewünschten Datensatzes

    Parameter:

    • identifier: Identifikationsnummer des gewünschten Datensatzes
    • metadataPrefix: Bezeichnung des Datenformats, in dem der Datensatz geliefert werden soll. Die zur Auswahl stehenden Werte können über den Befehl ListMetadataFormats (s. o.) abgefragt werden

  • ListRecords: Harvesten von Datensätzen mittels Angabe des Zeitraums (from / until) und/oder Datensets. Dies ist der Kernbefehl von OAI. Er ermöglicht selektives Harvesting, d. h. der Harvester kann seine Anfrage auf Datensätze beschränken, die

    • aus einem bestimmten Katalog stammen und
    • in einem bestimmten Zeitraum erzeugt oder geändert wurden

    Die Zeitangabe erfolgt in koordinierter Weltzeit UTC.

    Parameter:

    • from / until: Zeitpunkte, die den Zeitraum für das selektive Harvesting definieren. Diese können (je nach OAI-Repository) entweder Tagesgenauigkeit (YYYY-MM-DD) oder Sekundengenauigkeit haben (YYYY-MM-DDThh:mm:ssZ)
    • set: Der Katalog, aus dem die Datensätze stammen
    • metadataPrefix: s. o.
    • resumptionToken: Ermöglichen die Rückgabe von Teilantworten. Der OAI-Harvester bekommt einen Token, den er für eine neue Anfrage beim OAI-Repository nutzen kann, um die nächsten Antworten zu erhalten. Mit dem Token werden die Angaben Verfallsdatum, Größe der Gesamtliste und Zähler (optional) zurückgeliefert

Über OAI verfügbare Kataloge (sets) der Deutschen Nationalbibliothek

KatalogauswahlWert für Parameter "set"
Katalog der Deutschen Nationalbibliothek (DNB) ohne Gemeinsame Normdatei (GND)
dnb
Katalog der Deutschen Nationalbibliothek (DNB) inkl. Neuerscheinungsdienst (keine Autopsie) ohne GNDdnb-all
Einschränkung auf Sachgruppe
dnb:sg020 (Beispiel für Bibliotheks- und Informationswissenschaften)
Einschränkung auf Bibliografiereihe
dnb:reiheA (Beispiel)
Einschränkung auf Sachgruppe
dnb:reiheA:sg720 (Beispiel für Architektur)
Online-Publikationen der DNB
dnb:online
Einschränkung auf Sachgruppe
dnb:online:sg020 (Beispiel für Bibliotheks- und Informationswissenschaften)
Online Dissertationen der DNB
dnb:online:dissertations
Einschränkung auf Sachgruppe
dnb:online:dissertations:sg720 (Beispiel für Architektur)
Katalog der Gemeinsamen Normdatei (GND)
authorities

Formate

Folgende Formate werden in der Kodierung UTF-8 decomposed ("zerlegt") angeboten:

Formate und Beispiel
MARC 21-xml
Beispiel
XML-Variante von MARC 21http://www.loc.gov/standards/marcxml/schema/MARC21slim.xsd
MABxml-1
Beispiel
XML-Variante von MAB2
nur für Titeldaten,
Auslieferung endet am 30. Juni 2013
Schema-Definition
DNB Casual (oai_dc)
Beispiel
Auswahl von Dublin-Core-Elementen
nur für Titeldaten
http://www.openarchives.org/OAI/2.0/oai_dc.xsd
RDFxml
Beispiel
Linked Data Service
http://www.w3.org/2000/07/rdf.xsd

Testzugang / Zugangsvoraussetzungen

In einer 4-wöchigen Testphase können Sie die OAI-Schnittstelle kostenfrei nutzen.
Senden Sie uns dazu bitte eine kurze Nachricht an mit Ihren Kontaktdaten und einer festen IP-Adresse bzw. IP-Bereich und der Angabe des Katalogs und des gewünschten Formats. Alternativ ist der Zugriff über einen individuellen Zugangscode (access token) möglich. Wir melden uns schnellstmöglich bei Ihnen, um offene Fragen zu klären und alle eventuell zusätzlich erforderlichen Daten zu erfragen.
Nach einem erfolgreichen Testverlauf erhalten Sie auf Wunsch die Vertragsunterlagen für den Bezug kostenpflichtiger Daten.

Konditionen und Kosten

In der Testphase ist die Nutzung über die OAI-Schnittstelle generell kostenfrei.
Danach ist die Nutzung abhängig vom gewählten Set und dem gewünschten Datenformat teilweise kostenpflichtig.
Der Bezug von Normdaten und die Nutzung von Titeldaten zu Online Publikationen (Reihe O der Deutschen Nationalbibliografie) ist kostenfrei. Ebenfalls kostenfrei ist die Nutzung aller Daten im Format RDFxml und von Titeldaten im Format DNB Casual, siehe auch das Geschäftsmodell für die Nutzung von Datendiensten der Deutschen Nationalbibliothek. Alle weiteren Formate sind bei Nutzung der Titeldaten aus den Reihen A, B, C, H, M und T kostenpflichtig.

Folgende Kosten (Angaben in EUR) entstehen pro Jahr (gültig ab 1. Juli 2012):

ReiheInhaltFormate
MARC 21-XML und MABxml-1
Formate
DNB Casual und RDFxml
Reihe APublikationen des Verlagsbuchhandels 2.805,00kostenfrei
Reihe BPublikationen außerhalb des Verlagsbuchhandels 1.734,00kostenfrei
Reihe CKarten 204,00kostenfrei
Reihe HHochschulschriften756,00kostenfrei
Reihe MMusikalien (für OAI verfügbar ab Mitte 2013)240,00kostenfrei
Reihe OOnline-Publikationenkostenfreikostenfrei
Reihe TMusiktonträger (für OAI verfübar ab Mitte 2013)516,00kostenfrei
NeuerscheinungsdienstVerlegermeldungen zu Vorankündigungen und
Neuerscheinungen an das VLB
918,00kostenfrei
GNDGemeinsame Normdateikostenfreikostenfrei

Für Bezieher einzelner Reihen über den Datendienst ist der Zugriff über die OAI-Schnittstelle auf bereits abonnierte Reihen kostenfrei bzw. bereits im Bezugspreis enthalten.
Für die Ablieferer von Netzpublikationen ist der Zugriff über die OAI-Schnittstelle auf die eigenen abgelieferten Metadaten kostenfrei. Die Setabfrage „dnb:online“ muss dafür um die ID des Ablieferers ergänzt werden: „:dyn:ido:<ID des Ablieferers>“. Das Metadatenformat ist in diesem Fall DNB Casual.
Für Bibliotheksverbünde und Servicezentren werden gesonderte Vereinbarungen getroffen. Die kommerzielle Nutzung kostenpflichtiger Titeldaten (außerhalb CC0-Bedingungen) bedarf gesonderter Vereinbarungen.

Ansprechpartner / Kontakt

Ansprechpartner
Montag - Freitag von 9.00 -15.00 Uhr
Nicole von der HudeTel.: +49-69-1525-1632
Heike EichenauerTel.: +49-69-1525-1074

Praktische Beispiele

Syntax einer OAI-Anfrage

Syntax einer OAI-Anfrage mit Beispiel und Erklärung
BeispielErklärung
http://services.dnb.de/oai/repository
https://services.dnb.de/oai/repository
Anfrage an OAI-Server der Deutschen Nationalbibliothek
?verb=ListIdentifiersBefehl an den Server
&from=2012-04-23Parameter &from gibt den Beginn des Abfragezeitraums an
&until=2012-04-24Parameter &until gibt das Ende des Abfragezeitraumes an
&metadataPrefix=MARC21-xmlgewünschtes Format der OAI-Antwort
&set=authoritiesFestlegung des Katalogs bzw. Sets

Syntax einer OAI-Anfrage auf eine bestimmte ID-Nummer

http://services.dnb.de/oai/repository?verb=GetRecord&metadataPrefix=MARC21-xml&identifier=oai:dnb.de/authorities/118540238

Syntax einer OAI-Anfrage nach Online-Dissertationen aus der Sachgruppe "Sozialwissenschaften, Soziologie, Anthropologie" aus einem bestimmten Zeitraum

http://services.dnb.de/oai/repository?verb=ListRecords&from=2012-04-01T14:55:00Z&until=2012-07-08T09:54:59Z&metadataPrefix=oai_dc&set=dnb:online:dissertations:sg300

Anzahl der gelieferten Datensätze pro Anfrage

Eine Trefferliste ist auf maximal 100.000 Datensätze begrenzt. Es erfolgt eine Fehlermeldung bei größerer Treffermenge.

Letzte Änderung: 6.5.2013

Diese Seite

Schriftbanner mit Deutscher Nationalbibliothek Leipzig, Frankfurt am Main