Volltext-Downloads (blau) und Frontdoor-Views (grau)

Retrokonversion des Schlagwortkatalogs von Stadtarchiv und Stadthistorischer Bibliothek Bonn: Machbarkeitsstudie

  • Für die vorliegende Arbeit wurde ein Verfahren für die Retrokonversion des Schlagwortkatalogs (SWK) der Stadthistorischen Bibliothek Bonn (STAHB) entwickelt. Der Schlagwortkatalog (SWK) der Stadthistorischen Bibliothek Bonn (STAHB) und der darin verzeichnete Bestand werden vorgestellt. Bedarf sowie Anforderungen für die Retrokonversion des Kataloges werden formuliert und das Verfahren wird erläutert. Der Fokus liegt dabei auf der automatisierten Strukturierung von OCR-Daten anhand einer für die Studie entwickelten Anwendung. Lassen sich die OCR-Texte der zu verarbeitenden Karten des SWK automatisiert sinnvoll strukturieren, dabei Probleme erkennen, welche die exakte Strukturierung der Inhalte auf den Karten, sowie die Zuordnung von der Verzeichungseinheit auf der jeweiligen Karte zu dem dazugehörigen verzeichneten Dokument verhindern und lassen sich diese Probleme systematisch und automatisiert oder nur manuell beheben, sind Fragen, die untersucht werden. OCR-Daten aus 309 gescannten Katalogkarten des SWK wurden dafür anhand eines Python-Skripts strukturiert und die Ergebnisse anschließend manuell geprüft. Die Ergebnisse zeigen, dass sich nicht alle Probleme bei der Strukturierung der OCR-Daten über die entwickelte Anwendung erkennen und korrigieren lassen. Gründe dafür sind die Qualität der OCR-Daten, sowie der formale Aufbau und die Gestalt der Karten. Weniger als die Hälfte (47%) der aus den OCR-Daten erzeugten Datensätze sind danach korrekt, wobei die Strukturierung der Daten für die meisten Fälle gelungen ist. Neben weiteren Optimierungen in Bezug auf das Scannen, die OCR und der entwickelten Anwendung wird die Bedeutung von manuellen Prüfungen und Korrekturen für die Retrokonversion des Katalogs als Schlussfolgerung unterstrichen.
  • For this study, a procedure was developed for the retroconversion of the subject heading catalog (SWK) of the Stadthistorische Bibliothek Bonn (STAHB). The keyword catalog (SWK) of the Stadthistorische Bibliothek Bonn (STAHB) and the holdings listed in it are presented. Needs and requirements for the retroconversion of the catalog are formulated and the process is explained. The focus is on the automated structuring of OCR data using an application developed for the study. The questions investigated are whether the OCR texts of the SWK cards to be processed can be structured in an automated and meaningful way, whether problems can be identified that prevent the exact structuring of the content on the cards and the assignment of the reference unit on the respective card to the corresponding recorded document, and whether these problems can be solved systematically and automatically or only manually. OCR data from 309 scanned catalog cards of the SWK were structured using a Python script and the results were then checked manually. The results show that not all problems with the structuring of the OCR data can be recognized and corrected using the developed application. The reasons for this are the quality of the OCR data and the formal structure and shape of the catalog cards. Less than half (47%) of the data sets generated from the OCR data are correct, although the structuring of the data was successful in most cases. In addition to further optimizations in terms of scanning, OCR and the developed application, the importance of manual checks and corrections for the retroconversion of the catalog is underlined as a conclusion.

Download full text files

Export metadata

Additional Services

Search Google Scholar

Statistics

frontdoor_oas
Metadaten
Author:Gerrit Sommia
Document Type:Bachelor Thesis
Year of first Publication:2025
Date of final exam:2025/04/29
First Referee:Klaus LepskyGND
Advisor:Mirjam Blümm
Degree Program:Bibliothek und digitale Kommunikation
Language:German
Page Number:44
Tag:Stadtarchiv und Stadthistorische Bibliothek Bonn; Zeitungsausschnittsammlung
GND Keyword:Optische Zeichenerkennung; Retrospektive Konversion; Schlagwortkatalog
URN:urn:nbn:de:hbz:79pbc-opus-26836
Licence (German):License LogoCreative Commons - Namensnennung-Weitergabe unter gleichen Bedingungen