Konvertierung bibliografischer Referenzdaten in ein neutrales Austauschformat: Probleme und Lösungsmöglichkeiten am Beispiel der Datenbank "Literatur zur Informationserschließung"
- Die Konvertierung von bibliographischen Daten in andere Formate stellt eine häufige Herausforderung in der bibliothekarischen Arbeit dar, wie die Systemumstellung vieler Bibliotheken auf das Bibliotheksmanagementsystem Alma zeigt. Dabei ist die verlustfreie Durchführung dieses Prozesses eine besondere Schwierigkeit, die aus der Verschiedenheit der Formate resultiert. Ein konkretes Beispiel für eine solche zu konvertierende Datenmenge ist die Literaturdatenbank "Literatur zur Informationserschließung", welche 44.218 bibliographische Einträge enthält und von einer modifizierten Form des Allegro-Neutralformats in das RIS-Format konvertiert werden soll. Dabei wird auf der Grundlage von erarbeiteten Konkordanzen zwischen beiden Formaten und Untersuchungen der Datenbank mit regulären Ausdrücken, sowie einem Pythonskript ein Programm geschrieben, das die Datenbank in das Zielformat konvertieren soll. Das Ergebnis wird anhand einer proportionalen Schichtenstichprobe evaluiert. Abschließend werden der Entwicklungsprozess und das Ergebnis hinsichtlich des stattgefundenen Informationsverlustes bei dem Konvertierungsprozess reflektiert.
- The conversion of bibliographic data into other formats is a frequent challenge in library work, as the system conversion of many libraries to the Alma library management system shows. The loss-free implementation of this process is a particular difficulty resulting from the diversity of formats. A concrete example of such a data set to be converted is the literature database "Literature on information indexing", which contains 44,218 bibliographic entries and is to be converted from a modified form of the Allegro neutral format into the RIS format. Based on concordances between the two formats and investigations of the database with regular expressions and a Python script, a program is written to convert the database into the target format. The result is evaluated using a proportional stratified random sample. Finally, the development process and the result are reflected with regard to the loss of information during the conversion process.
Author: | Kevin Blischke |
---|---|
Document Type: | Bachelor Thesis |
Year of first Publication: | 2024 |
Date of final exam: | 2024/03/11 |
First Referee: | Klaus LepskyGND |
Advisor: | Mirjam Blümm |
Degree Program: | Bibliothek und digitale Kommunikation |
Language: | German |
Page Number: | 44 |
Tag: | Allegro-Neutralformat; Bibliographische Datenkonvertierung; Datenkonvertierungsprogramm; RIS-Format |
URN: | urn:nbn:de:hbz:79pbc-opus-24927 |
Licence (German): | Creative Commons - Namensnennung-Weitergabe unter gleichen Bedingungen |