Volltext-Downloads (blau) und Frontdoor-Views (grau)
The search result changed since you submitted your search request. Documents might be displayed in a different sort order.
  • search hit 3 of 535
Back to Result List

Konvertierungsprobleme bei bibliothekarischen Austauschformaten: Erstellen einer trec_eval-Testkollektion im Solr-kompatiblen XML-Format aus MARC-XML-Daten

  • Das Ziel dieser Bachelorarbeit ist es, die Unterschiede zwischen dem MARC-XML-Format und einem Solr kompatiblen XML-Format zu analysieren, um die Daten einer DNB-Testkollektion für ein Retrievaltest-Projekt der TH Köln mit der Software trec_eval auswerten zu können. Dazu wird die Datenstruktur der Dokumente der Testkollektion im MARC-XML-Format auf die für den Test relevanten Inhalte reduziert. Es wird dargestellt, wie diese Datenstruktur an das Zielformat XML angepasst und konvertiert wird, um einen Retrievaltest durchführen zu können. Die nach einer Datenkonvertierung entstehenden Probleme sollen durch das Erstellen einer Konkordanz abgebildet werden. Exemplarisch werden die Kategorien innerhalb der Dokumente der Testkollektion untersucht, die maschinell und intellektuell Erschlossene Metadaten enthalten. Abschließend wird darauf hingewiesen, welche Auswirkungen fehlerhafte Kategorieninhalte auf einen Retrievaltest haben können. Ziel soll es sein eine Empfehlung dahingehend abzugeben, wie die Testkollektion den Qualitätsanforderungen des TH-Projekts entsprechend verbessert werden kann, um eine Evaluation der DNB-Sacherschließungspraxis zu ermöglichen.
  • This bachelor thesis analyses the differences between MARC XML data and Solr-compatible XML data. The results will be used in an evaluation of test collection data provided by the German National Library, using the software trec_eval. This project is currently ongoing at the Cologne University of Applied Sciences. To accomplish this, the MARC XML data structure of the documents contained within the test collection will be reduced to its most relevant contents. The thesis demonstrates how this data structure is adapted and converted to the target XML format, so that it can be used in a retrieval test. The problems resulting from data conversion processes will be demonstrated using a concordance. As an example, the data categories of test collection documents containing intellectual or automatic subject indexing metadata will be examined. In conclusion, the thesis demonstrates the consequences of incorrect category contents in the context of a retrieval test. The objective is to formulate a recommendation concerning improvements to the test collection so that it meets all quality criteria of the project at the Cologne University of Applied Sciences. This will enable an evaluation of the German National Library’s subject indexing methods.

Export metadata

Additional Services

Search Google Scholar

Statistics

frontdoor_oas
Metadaten
Author:Thomas Schulz
Document Type:Bachelor Thesis
Year of first Publication:2019
Date of final exam:2019/08/30
First Referee:Klaus Lepsky
Advisor:Stefanie Scholz
Degree Program:Bibliothekswissenschaft
Language:German
Page Number:60
Tag:automatisches Indexieren
GND Keyword:Datenkonvertierung; Inhaltserschließung; Konkordanz
Access Rights:Zugriffsbeschränkt
Licence (German):License LogoCreative Commons - Namensnennung-Weitergabe unter gleichen Bedingungen