Refine
Year of publication
- 2023 (2)
Document Type
- Bachelor Thesis (1)
- Master's Thesis (1)
Language
- German (2)
Has Fulltext
- yes (2)
Keywords
- Transkription (2) (remove)
Der digitale Wandel, getrieben durch die Evolution von „New Media“ mit ihren interaktiven, multimedialen Merkmalen und globaler Zugänglichkeit, hat nachhaltige Auswirkungen auf die Bereiche Journalismus, Unterhaltung und Wissenschaftskommunikation hinterlassen. Innerhalb dieses Rahmens dienen Podcasts als zugängliche, offene Plattform zur Verbreitung wissenschaftlicher Informationen und zur Förderung interdisziplinärer Diskussionen, wobei Herausforderungen im Hinblick auf die auditiven Eigenschaften und die Notwendigkeit evidenzbasierter Kommunikation bestehen. Das Hauptziel dieser Studie besteht darin, die jüngsten Fortschritte in KI-gesteuerten Transkriptionsverfahren zu nutzen, um effiziente und hochwertige Transkriptionen zu realisieren. Darüber hinaus werden neue Ansätze zur Steigerung der Auffindbarkeit, Zugänglichkeit und Verbreitung wissenschaftlicher Inhalte diskutiert. Für diese Studie wurden Audio-Daten aus dem bilingualen Common Voice-Datensatz und dem englisch-sprachigen GigaSpeech-Datensatz verwendet, um automatisierte Transkriptionen zu erstellen. Die Transkriptionen wurden anschließend mithilfe von Metriken wie der Wortfehlerrate und des Jaro-Winkler-Ähnlichkeitsmaß bewertet. Die Ergebnisse dieser Untersuchung verdeutlichen, dass die Genauigkeit des ASR-Modells „Whisper“ von OpenAI von verschiedenen Faktoren abhängig ist. Hierzu zählen die Sprache, verschiedene Dialekte, Akzente, Altersgruppen und Themengebiete. Im Gesamten betrachtet konnte die Transkription von englischen im Vergleich zu deutschen Daten präziser durchgeführt werden. Trotz gelegentlicher Fehler zeigten die durch ASR generierten Transkriptionen eine signifikante Ähnlichkeit zur Ground Truth, was auf ihr Potenzial für die Transkription von Podcasts hinweist. Ein Vergleich verschiedener Modellgrößen ergab, dass größere Modelle eine überlegene Leistung erbrachten. Diese robusten Ergebnisse legen nahe, dass Transkriptionen eine sinnvolle Ergänzung zu den vorhandenen Metadaten von Podcasts darstellen und zur Verbesserung von Retrieval-Anwendungen genutzt werden können.
Des Weiteren bieten Transkriptionen eine solide Grundlage für die Anwendung fortgeschrittener Methoden des NLP zur Extraktion entscheidender Informationen, wie beispielsweise Verweise und Entitäten, welche in ein vernetztes System, wie Knowledge Graphs, integriert werden können, um Podcast-Inhalte auf effiziente Weise zu strukturieren und Verknüpfungen zu anderen Wissensquellen herzustellen.
Eignen sich kleine Bibliotheken für Citizen Science-Projekte? Verschiedene Aspekte verbergen sich hinter dieser kurzen Eingangsfrage: Was sind kleine Bibliotheken? Was bedeutet Citizen Science? Eignen sich Bibliotheken generell für entsprechende Projekte und wenn ja, warum sollten sich kleine Bibliotheken ggfs. nicht oder eben doch besonders eignen? Die vorliegende Masterarbeit möchte diese Fragestellungen anhand des Beispiels von Kreisarchiv und Landeskundlicher Bibliothek des Märkischen Kreises beantworten.
Dazu werden zunächst die Begrifflichkeiten definiert. Neben Citizen Science gilt es Vokabeln wie Citizen Humanities oder Crowdsourcing zu diskutieren. Bevor ausgewählte Projekte als Best Practices beleuchtet werden, untersucht die Arbeit, ob sich Bibliotheken und vergleichbare Wissenseinrichtungen als Orte für Citizen Science eignen und ob die Dokumente aus den Magazinen generell als lohnenswert für eine Erforschung durch die interessierte Öffentlichkeit einzustufen sind.
Anschließend befragt die vorliegende Ausarbeitung ausgewählte Bestände von Landeskundlicher Bibliothek und Kreisarchiv des Märkischen Kreises auf ihr Potential für etwaige Citizen Science-Projekte und überprüft diese auf ihre Durchführbarkeit mit den vorhandenen Mitteln der Beispieleinrichtung. In einem Fazit werden die Erkenntnisse dieser vergleichenden Betrachtung bewertet und vorgestellt, welches Learning diese Machbarkeitsstudie vergleichbaren kleinen Einrichtungen anbieten kann.