Navigation und Service

OAI - häufig gestellte Fragen (FAQ) / Fehlerbehebung

OAI - im Überblick

Was ist der Unterschied zwischen SRU und OAI?

SRU ermöglicht die dezidierte Recherche ohne eine eigene Datenbank vorzuhalten.
OAI ermöglicht eine ständige Synchronisation großer Datenbestände, dies setzt den Datenimport eines aktuellen Grundbestandes in eine eigene Datenbank voraus.

Wie erhalte ich Zugriff auf die OAI-Schnittstelle?

Für einen kostenfreien Zugang zur OAI-Schnittstelle benötigen Sie ein personalisiertes Kundenkonto. Dazu nutzen Sie bitte das Registrierungsformular und senden dann eine E-Mail an mit Ihren Kontaktdaten, dem gewünschten OAI-Set, dem Datenformat und ggf. der Angabe einer festen IP-Adresse bzw. IP-Bereich. Alternativ ist der Zugriff über einen individuellen Zugangscode (access token) möglich. Sie erhalten eine Nachricht von uns, sobald der Zugang freigeschaltet ist.

Was kann über OAI abgefragt werden?

Eine OAI-Anfrage liefert alle Datensätze zurück, die in dem angegebenen Zeitraum geändert oder neu erstellt wurden.

Was kann nicht über OAI abgefragt werden?

Es ist nicht möglich, alle Datensätze zu einem bestimmten Kriterium – ein anderes, als das Änderungsdatum – abzufragen. Für eine solche Anfrage ist die SRU-Schnittstelle zu verwenden.
Es ist nicht möglich, alle neuen Sätze über die OAI-Schnittstelle abzufragen. Wieso?
Wird ein Datensatz neu erzeugt, ist das Änderungsdatum gleich dem Erstellungsdatum. Wird nun zu einem späteren Zeitpunkt dieser Datensatz manuell oder automatisch verändert, ändert sich das Änderungsdatum und eine Anfrage an die OAI-Schnittstelle mit dem Zeitraum des Erstelldatums würde keinen Treffer liefern, obwohl dieser Satz tatsächlich zu diesem Zeitpunkt erstellt wurde. Dieser Satz würde erst ausgeliefert, wenn der Zeitraum der letzten Änderung angegeben wird, da nur dieses Kriterium von OAI berücksichtigt wird.

Wie häufig kann das Repository der DNB mittels OAI abgefragt werden?

DNB empfiehlt eine Abfragefrequenz nicht unter einer Minute, da es ansonsten zu doppelten Datenlieferungen kommen kann (nicht relevant für OAI-Anfragen mit "resumptionToken"). Die Abfragesequenz sollte nicht kleiner sein, als der abgefragte Zeitraum.

Ist die Anzahl der Datensätze pro OAI-Antwort begrenzt?

Eine Trefferliste ist auf 100.000 Datensätze begrenzt. Es erfolgt eine Fehlermeldung bei größerer Treffermenge. Der Abfragezeitraum und –frequenz ist entsprechend einzuschränken.

Welcher Zeitraum kann abgefragt werden? Gibt es eine Empfehlung?

Der Abfragezeitraum sollte nicht zu weit reichen, um eine Treffermenge über 100.000 Datensätzen zu vermeiden. Empfehlung bei nicht zeitkritischen Verfahren für Abfragezeitraum/Frequenz: 30 Minuten. Bei kleinen Sets (z. B. Online-Dissertationen) reicht ein einmal tägliches oder einmal wöchentliches Harvesting aus, da dadurch ein Datensatz, der in diesem Zeitraum mehrfach geändert wurde nur einmal bezogen wird und die Treffermenge trotzdem nicht zu groß wird.
Wir empfehlen zudem als Wiederaufsetzzeitpunkt ("from") die Zeitangabe im Element "responseDate", z. B. <responseDate>2015-08-30T08:12:54Z</responseDate> zu nutzen, da diese Zeitangabe der aktuellen Verfügbarkeit der Daten in unserem Repository am besten entspricht. Zusätzlich empfehlen wir das Harvesten mit einer geringen zeitlichen Überlappung ("responseDate" minus eine Minute = "from").

Wie verhindert DNB, dass umfangreiche Verarbeitungen die Übernahme aktueller Daten verzögert?

Bei Sonderaktionen mit Änderungen an über 50.000 Datensätzen, gehen wir folgendermaßen vor:

  • Umfangreiche Sonderaktionen werden am Wochenende/Feiertag durchgeführt
  • Die Änderungen an den Datensätzen werden nicht protokolliert, sodass diese Daten über den OAI-Index nicht sichtbar sind
  • Die Datenänderungen sind erst zu einem späteren Zeitpunkt im OAI-Index sichtbar, wenn der OAI-Index komplett neu generiert wurde

Ein zeitnah harvestendes System bekommt somit von den Änderungen nichts mit, auch wenn es kontinuierlich durchläuft. Nur wenn es sich um relevante Änderungen für ein harvestendes System handelt, kann das Harvest-Zeitintervall entsprechend zurück­gesetzt werden.

Werden auch Löschungen geliefert?

Löschungen im Sinne von OAI werden nicht geliefert.
Für die ZDB-Titel- und -Lokaldaten sowie die GND werden gelöschte und umgelenkte Sätze als verkürzte Datensätze geliefert, entsprechend gekennzeichnet und verfügen über ID-Nummern, Standard- und Datumsfelder.
Entsprechend gekennzeichnete Lokaldaten sind maximal eine Woche über die OAI-Schnittstelle verfügbar (weitere Informationen im FAQ ILTIS).
Der Geschäftsgang für Titel-Änderungen ist noch nicht abschließend konzipiert.

Mehrbändig begrenzte Werke bzw. mehrteilige Monografien: Bezug übergeordneter Datensätze (Kopfsätze)

Über die OAI-Schnittstelle werden nur die Datensätze der Teile (mit abhängigem oder unabhängigem Titel) ausgeliefert. Im Gegensatz dazu werden über den Datendienst via FTP/WWW-Server sowohl die Datensätze der Teile als auch die übergeordneten Datensätze (Kopfsätze) bereitgestellt. Über OAI-PMH ist jedoch ebenfalls die Abfrage der Kopfsätze über den entsprechenden Identifier generell möglich. Dieser Identifier ist je nach Datensatztyp (mit abhängigem oder unabhängigem Titel) und Format in unterschiedlichen Feldern bzw. Elementen der Datensätze der Teile hinterlegt, s. Übersicht.

Können bestimmte Einträge in einem bestimmten Zeitraum erwartet werden?

Nein, da Datensätze immer wieder geändert werden und Datensätze über OAI nur mittels des Änderungsdatums recherchiert werden können, lässt sich nicht vorhersagen, wann ein bestimmter Satz in einer OAI-Antwort enthalten ist.

Gültigkeitszeitraum und Verwendung eines "resumptionToken"?

Ermöglichen die Rückgabe von Teilantworten. Der OAI-Harvester bekommt einen Token, den er für eine neue Anfrage beim OAI-Repository nutzen kann, um die nächsten Antworten zu erhalten. Mit dem Token werden die Angaben aktuelle Listenposition und Größe der Gesamtliste (cursor="50" completeListSize="XXXXXXX") zurückgeliefert. Erfahrungsgemäß ist ein "resumptionToken" bei einer ListRecords-Abfrage ca. 40-45 Minuten gültig. Die Listenposition in nächsten OAI-Antwort ist frei konfigurierbar mittels Angabe nach dem Unterstrich z. B. resumptionToken=XXXXXXX_150 (Start mit Listenposition 150). Pro OAI-Antwort werden 50 Datensätze geliefert.

Was ist koordinierte Weltzeit (UTC)?

Die koordinierte Weltzeit wird auch UTC (Universal Time Coordinated) genannt und ist die Grundlage zur Berechnung der Ortszeit.
Beispiel für Deutschland:
Ortszeit für Berlin ist UTC+1 (während der Sommerzeit gilt UTC+2). Die Zeitangabe seitens des OAI-Servers erfolgt in koordinierter Weltzeit UTC.
Zur aktuellen Ortszeit 10:30 Uhr ist es daher nur sinnvoll bis UTC 9:29 Uhr zu harvesten, während der Sommerzeit somit bis UTC 8:29 Uhr.

Wie werden Markup-Zeichen in einer OAI-Antwort transportiert?

Innerhalb einer OAI-Antwort werden Markup-Zeichen (<, > und &) in einem CDATA-Abschnitt transportiert.

Anfrage / Fehlermeldung

Bitte senden Sie konkrete Anfragen / Fehlermeldungen zur OAI-Schnittstelle zeitnah. Nur so ist eine Nachvollziehbarkeit gewährleistet und Sie unterstützen damit die Fehlerbehebung.
Bitte senden Sie Anfragen / Fehlermeldungen immer mit folgenden Angaben an :

  1. Syntax OAI-PMH-Anfrage (Set, Format, Zeitraum)
  2. Fehlermeldung / Beschreibung
  3. Kontext (wiederholt, sporadisch, verwendeter Client …)

Letzte Änderung: 27.05.2016

Diese Seite

Schriftbanner mit Deutscher Nationalbibliothek Leipzig, Frankfurt am Main