Refine
Document Type
- Bachelor Thesis (2)
Language
- German (2)
Has Fulltext
- no (2) (remove)
Keywords
- Inhaltserschließung (2) (remove)
Aktuell ist kein Expertensuchsystem auf Webseite der TH Köln vorhanden, über das Interessierte oder Forschende nach Themengebieten bzw. Wissenschaftsfächer der jeweiligen Experten suchen können. Im Rahmen des Projekts Research Knowledge Discovery – Detektion von Experten und Aufbau eines Recommender-Systems für die TH Köln wurden einige Arbeitsergebnisse geschafft, wie die durchgeführte inhaltliche Erschließung und somit die Erstellung eines einfachen Erschließungskonzept. Da bei der Strukturierung des Vokabulars Verbesserungsmöglichkeiten vorhanden sind, ist das Ziel der vorliegenden Bachelorarbeit die Erstellung eines systematischen Thesaurus der TH Köln für ein Expertensuchsystem auf Basis der durch Research Knowledge Discovery – Detektion von Experten und Aufbau eines Recommender-Systems für die TH Köln gemachten Projekte. Sowohl für ein Suchsystem als auch Expertensuchsystem ist eine Navigations- und Suchfunktion erforderlich. Infolgedessen wird das Vokabular für das Navigieren benötigt.
Um dies zu erzielen, wurden im Programm MIDOS6 – MIDOSThesaurus Thesaurus und Systematik der Wissenschaftsfächer der TH Köln entwickelt. Vor der Erstellung des Thesaurus in der Kombination mit Systematik wurde die inhaltliche Erschließung der ausgewählten Datenbasis in der Excel-Datei durchgeführt. Inhaltlich erschlossene Begriffe wurden als Deskriptoren der dritten Hierarchiestufe im Thesaurus zugeordnet.
In weiterführenden Projektarbeiten kann der systematische Thesaurus weiter mit Verbesserungsvorschlägen optimiert und in ein Expertensuchsystem eingebaut werden, sodass die Suche der Interessierten oder Forschenden nach Experten der jeweiligen Wissenschaftsfächer erleichtert wird.
Das Ziel dieser Bachelorarbeit ist es, die Unterschiede zwischen dem MARC-XML-Format und einem Solr kompatiblen XML-Format zu analysieren, um die Daten einer DNB-Testkollektion für ein Retrievaltest-Projekt der TH Köln mit der Software trec_eval auswerten zu können. Dazu wird die Datenstruktur der Dokumente der Testkollektion im MARC-XML-Format auf die für den Test relevanten Inhalte reduziert. Es wird dargestellt, wie diese Datenstruktur an das Zielformat XML angepasst und konvertiert wird, um einen Retrievaltest durchführen zu können. Die nach einer Datenkonvertierung entstehenden Probleme sollen durch das Erstellen einer Konkordanz abgebildet werden. Exemplarisch werden die Kategorien innerhalb der Dokumente der Testkollektion untersucht, die maschinell und intellektuell Erschlossene Metadaten enthalten. Abschließend wird darauf hingewiesen, welche Auswirkungen fehlerhafte Kategorieninhalte auf einen Retrievaltest haben können. Ziel soll es sein eine Empfehlung dahingehend abzugeben, wie die Testkollektion den Qualitätsanforderungen des TH-Projekts entsprechend verbessert werden kann, um eine Evaluation der DNB-Sacherschließungspraxis zu ermöglichen.