OAI im Überblick
OAI (Open Archives Initiative) ist eine Initiative, die die Definition einer offenen Schnittstelle zum Austausch von Metadaten zum Ziel hat. Die Kommunikation einer solchen Schnittstelle erfolgt zwischen der Deutschen Nationalbibliothek als Datenlieferant (data provider) und einem Dienstanbieter (service provider), der die Daten bezieht. Der Bezug erfolgt automatisiert durch einen sogenannten „OAI-Harvester“. Das Protokoll, welches für die Kommunikation verwendet wird, hat die Bezeichnung OAI-PMH (OAI-Protocol for Metadata Harvesting). OAI ermöglicht eine ständige Synchronisation großer Datenbestände, dies setzt den Datenimport eines aktuellen Grundbestandes in eine eigene Datenbank voraus.
Nach Anmeldung und Autorisierung bietet die Deutsche Nationalbibliothek über eine HTTP- oder HTTPS-Schnittstelle und das OAI-PMH-Protokoll eine Anfragemöglichkeit auf ihre Daten.
- Standard der OAI-Schnittstelle
- OAI-PMH Protokoll
- OAI-Harvester
- OAI-Funktionen
- Über OAI verfügbare Kataloge (sets) der Deutschen Nationalbibliothek
- Formate
- Testzugang / Zugangsvoraussetzungen
- Konditionen und Kosten
- Ansprechpartner / Kontakt
- Praktische Beispiele
OAI - Häufig gestellte Fragen (FAQ) / Fehlerbehebung
Standard der OAI-Schnittstelle
Protokoll: OAI-PMH Version 2.0
OAI-PMH Protokoll
Das Protokoll OAI-PMH ist webbasiert. Der OAI-Harvester arbeitet mit einfachen Anfragen per HTTP-GET oder -POST und erhält eine HTTP-Antwort vom Datenlieferanten zurück. Diese Antwort enthält, eingebettet in eine XML-Struktur, die angeforderten Metadaten. Ein Vorzug dabei ist, dass ein OAI-Repository auch mit einem Webbrowser abgefragt werden kann.
OAI-Harvester
Um OAI zum Abgleich der Daten zwischen der Deutschen Nationalbibliothek und einem Dienstanbieter nutzen zu können, muss auf Seiten des Dienstanbieters ein OAI-Harvester (z. B. OAI-PMH Harvester Manager) implementiert werden. Der OAI-Harvester ruft sich in einer Endlosschleife immer wieder selbst auf. Er führt dabei einen „ListRecords-Befehl“ aus, der sich auf das für den Dienstanbieter definierte Datenset (Katalog) beschränkt. Desweiteren wird dem „ListRecords-Befehl“ über einen Zeitstempel, der Zeitpunkt des letztmaligen Aufrufs mitgegeben. Auf diese Weise ist gewährleistet, dass
- keine Änderung verpasst wird
- sich Änderungen zeitnah in der Dienstanbieter-Datenbank widerspiegeln
- keine für den Service Provider irrelevanten Daten transportiert werden
OAI-Funktionen
Das Protokoll OAI-PMH enthält sechs Basisfunktionen, die an die baseURL (z. B. "http://services.dnb.de/oai/repository") mit "?verb=" angefügt werden:
Identify: Anzeige von allgemeinen Informationen zum OAI-Repository, z. B.
- repositoryName
- baseURL
- protocolVersion
ListSets: Informationen zu allen im OAI-Repository zur Verfügung stehenden Datensets (Kataloge)
ListMetadataFormats: Auflistung aller im OAI-Repository zur Verfügung stehenden Datenformate
GetRecord: Abruf einzelner Datensätze mittels ID-Angabe. Voraussetzung ist die Kenntnis der Identifikationsnummer des gewünschten Datensatzes
Parameter:
- identifier: Identifikationsnummer des gewünschten Datensatzes
- metadataPrefix: Bezeichnung des Datenformats, in dem der Datensatz geliefert werden soll. Die zur Auswahl stehenden Werte können über den Befehl ListMetadataFormats (s. o.) abgefragt werden
ListRecords: Harvesten von Datensätzen mittels Angabe des Zeitraums (from / until) und/oder Datensets. Dies ist der Kernbefehl von OAI. Er ermöglicht selektives Harvesting, d. h. der Harvester kann seine Anfrage auf Datensätze beschränken, die
- aus einem bestimmten Katalog stammen und
- in einem bestimmten Zeitraum erzeugt oder geändert wurden
Die Zeitangabe erfolgt in koordinierter Weltzeit UTC.
Parameter:
- from / until: Zeitpunkte, die den Zeitraum für das selektive Harvesting definieren. Diese können (je nach OAI-Repository) entweder Tagesgenauigkeit (YYYY-MM-DD) oder Sekundengenauigkeit haben (YYYY-MM-DDThh:mm:ssZ)
- set: Der Katalog, aus dem die Datensätze stammen
- metadataPrefix: s. o.
- resumptionToken: Ermöglichen die Rückgabe von Teilantworten. Der OAI-Harvester bekommt einen Token, den er für eine neue Anfrage beim OAI-Repository nutzen kann, um die nächsten Antworten zu erhalten. Mit dem Token werden die Angaben Verfallsdatum, Größe der Gesamtliste und Zähler (optional) zurückgeliefert
Über OAI verfügbare Kataloge (sets) der Deutschen Nationalbibliothek
| Katalogauswahl | Wert für Parameter "set" |
|---|---|
| Katalog der Deutschen Nationalbibliothek (DNB) ohne Gemeinsame Normdatei (GND) | dnb |
| Katalog der Deutschen Nationalbibliothek (DNB) inkl. Neuerscheinungsdienst (keine Autopsie) ohne GND | dnb-all |
| Einschränkung auf Sachgruppe | dnb:sg020 (Beispiel für Bibliotheks- und Informationswissenschaften) |
| Einschränkung auf Bibliografiereihe | dnb:reiheA (Beispiel) |
| Einschränkung auf Sachgruppe | dnb:reiheA:sg720 (Beispiel für Architektur) |
| Online-Publikationen der DNB | dnb:online |
| Einschränkung auf Sachgruppe | dnb:online:sg020 (Beispiel für Bibliotheks- und Informationswissenschaften) |
| Online Dissertationen der DNB | dnb:online:dissertations |
| Einschränkung auf Sachgruppe | dnb:online:dissertations:sg720 (Beispiel für Architektur) |
| Katalog der Gemeinsamen Normdatei (GND) | authorities |
Formate
Folgende Formate werden in der Kodierung UTF-8 decomposed ("zerlegt") angeboten:
| MARC 21-xml Beispiel | XML-Variante von MARC 21 | http://www.loc.gov/standards/marcxml/schema/MARC21slim.xsd |
| MABxml-1 Beispiel | XML-Variante von MAB2 nur für Titeldaten, Auslieferung endet am 30. Juni 2013 | Schema-Definition |
| DNB Casual (oai_dc) Beispiel | Auswahl von Dublin-Core-Elementen nur für Titeldaten | http://www.openarchives.org/OAI/2.0/oai_dc.xsd |
| RDFxml Beispiel | Linked Data Service | http://www.w3.org/2000/07/rdf.xsd |
Testzugang / Zugangsvoraussetzungen
In einer 4-wöchigen Testphase können Sie die OAI-Schnittstelle kostenfrei nutzen.
Senden Sie uns dazu bitte eine kurze Nachricht an Schnittstellen-Service mit Ihren Kontaktdaten und einer festen IP-Adresse bzw. IP-Bereich und der Angabe des Katalogs und des gewünschten Formats. Alternativ ist der Zugriff über einen individuellen Zugangscode (access token) möglich. Wir melden uns schnellstmöglich bei Ihnen, um offene Fragen zu klären und alle eventuell zusätzlich erforderlichen Daten zu erfragen.
Nach einem erfolgreichen Testverlauf erhalten Sie auf Wunsch die Vertragsunterlagen für den Bezug kostenpflichtiger Daten.
Konditionen und Kosten
In der Testphase ist die Nutzung über die OAI-Schnittstelle generell kostenfrei.
Danach ist die Nutzung abhängig vom gewählten Set und dem gewünschten Datenformat teilweise kostenpflichtig.
Der Bezug von Normdaten und die Nutzung von Titeldaten zu Online Publikationen (Reihe O der Deutschen Nationalbibliografie) ist kostenfrei. Ebenfalls kostenfrei ist die Nutzung aller Daten im Format RDFxml und von Titeldaten im Format DNB Casual, siehe auch das Geschäftsmodell für die Nutzung von Datendiensten der Deutschen Nationalbibliothek. Alle weiteren Formate sind bei Nutzung der Titeldaten aus den Reihen A, B, C, H, M und T kostenpflichtig.
Folgende Kosten (Angaben in EUR) entstehen pro Jahr (gültig ab 1. Juli 2012):
| Reihe | Inhalt | Formate MARC 21-XML und MABxml-1 | Formate DNB Casual und RDFxml |
|---|---|---|---|
| Reihe A | Publikationen des Verlagsbuchhandels | 2.805,00 | kostenfrei |
| Reihe B | Publikationen außerhalb des Verlagsbuchhandels | 1.734,00 | kostenfrei |
| Reihe C | Karten | 204,00 | kostenfrei |
| Reihe H | Hochschulschriften | 756,00 | kostenfrei |
| Reihe M | Musikalien (für OAI verfügbar ab Mitte 2013) | 240,00 | kostenfrei |
| Reihe O | Online-Publikationen | kostenfrei | kostenfrei |
| Reihe T | Musiktonträger (für OAI verfübar ab Mitte 2013) | 516,00 | kostenfrei |
| Neuerscheinungsdienst | Verlegermeldungen zu Vorankündigungen und Neuerscheinungen an das VLB | 918,00 | kostenfrei |
| GND | Gemeinsame Normdatei | kostenfrei | kostenfrei |
Für Bezieher einzelner Reihen über den Datendienst ist der Zugriff über die OAI-Schnittstelle auf bereits abonnierte Reihen kostenfrei bzw. bereits im Bezugspreis enthalten.
Für die Ablieferer von Netzpublikationen ist der Zugriff über die OAI-Schnittstelle auf die eigenen abgelieferten Metadaten kostenfrei. Die Setabfrage „dnb:online“ muss dafür um die ID des Ablieferers ergänzt werden: „:dyn:ido:<ID des Ablieferers>“. Das Metadatenformat ist in diesem Fall DNB Casual.
Für Bibliotheksverbünde und Servicezentren werden gesonderte Vereinbarungen getroffen. Die kommerzielle Nutzung kostenpflichtiger Titeldaten (außerhalb CC0-Bedingungen) bedarf gesonderter Vereinbarungen.
Ansprechpartner / Kontakt
| Schnittstellen-Service | Montag - Freitag von 9.00 -15.00 Uhr |
| Nicole von der Hude | Tel.: +49-69-1525-1632 |
| Heike Eichenauer | Tel.: +49-69-1525-1074 |
Praktische Beispiele
Syntax einer OAI-Anfrage
| Beispiel | Erklärung |
|---|---|
| http://services.dnb.de/oai/repository https://services.dnb.de/oai/repository | Anfrage an OAI-Server der Deutschen Nationalbibliothek |
| ?verb=ListIdentifiers | Befehl an den Server |
| &from=2012-04-23 | Parameter &from gibt den Beginn des Abfragezeitraums an |
| &until=2012-04-24 | Parameter &until gibt das Ende des Abfragezeitraumes an |
| &metadataPrefix=MARC21-xml | gewünschtes Format der OAI-Antwort |
| &set=authorities | Festlegung des Katalogs bzw. Sets |
Syntax einer OAI-Anfrage auf eine bestimmte ID-Nummer
http://services.dnb.de/oai/repository?verb=GetRecord&metadataPrefix=MARC21-xml&identifier=oai:dnb.de/authorities/118540238
Syntax einer OAI-Anfrage nach Online-Dissertationen aus der Sachgruppe "Sozialwissenschaften, Soziologie, Anthropologie" aus einem bestimmten Zeitraum
http://services.dnb.de/oai/repository?verb=ListRecords&from=2012-04-01T14:55:00Z&until=2012-07-08T09:54:59Z&metadataPrefix=oai_dc&set=dnb:online:dissertations:sg300
Anzahl der gelieferten Datensätze pro Anfrage
Eine Trefferliste ist auf maximal 100.000 Datensätze begrenzt. Es erfolgt eine Fehlermeldung bei größerer Treffermenge.
Letzte Änderung: 6.5.2013


