Navigation und Service

Leipzig: Mittwoch 28.05.2025

Die Lesesäle der Deutschen Nationalbibliothek Leipzig öffnen am Mittwoch, den 28.05. wegen einer Personalversammlung erst ab 13 Uhr. Die Ausstellungen des Deutschen Buch- und Schriftmuseums sind von 10 bis 18 Uhr geöffnet.

Frankfurt: Donnerstag 05.06.2025

Die Lesesäle der Deutschen Nationalbibliothek in Frankfurt am Main öffnen am Donnerstag, den 05.06. wegen einer Personalversammlung erst ab 13 Uhr. Die Ausstellungen des Deutschen Exilarchivs 1933-1945 sind von 9 bis 21:30 Uhr geöffnet.

Inhaltliche Erschließung von wissenschaftlichen Publikationen durch Machine Learning

Aufgeschlagenes Buch mit neuronalem Netz im Hintergrund, im Vordergrund eine farbige Fläche mit dem Titel des Projektes.

Projektbeschreibung

Ziel des Projektes ist, Machine-Learning-Modelle zu entwickeln. Grundlage dafür ist der umfangreiche Bestand an Metadaten der Deutschen Nationalbibliothek. Die Modelle sollen dazu dienen, Inhalte von wissenschaftlichen Veröffentlichungen mathematisch zu erschließen, um sie auf abstrakter Ebene zu verstehen und untereinander in Beziehung zu setzen. Dadurch wird unter anderem eine inhaltliche Suche ermöglicht. Als Grundlage werden vortrainierte freie Sprachmodelle verwendet – das Projekt unterscheidet sich allerdings von Large Language Models der Tech-Konzerne. Im Projekt wird anhand eines speziell für diesen Zweck hergestellten Trainings-Datensatzes aus DNB-Beständen an einem möglichst schlanken, aber auf die Anwendung optimierten Modell gearbeitet. Darüber hinaus soll eine Webanwendung entwickelt werden, die es Nutzenden ermöglicht, die inhaltliche Nähe und Distanz zwischen Veröffentlichungen zu visualisieren und nach inhaltlich ähnlichen Einträgen zu suchen.

Das Projekt wurde von Linus Herterich und Max Schaible beantragt und wird von ihnen bearbeitet.

Laufzeit

Oktober 2024 - März 2025

Kontakt

DH-Stipendien@dnb.de

Letzte Änderung: 22.10.2024
Kontakt: DH-Stipendien@dnb.de

nach oben