Refine
Year of publication
Document Type
- Bachelor Thesis (248)
- Master's Thesis (151)
- Part of a Book (50)
- Diploma Thesis (34)
- Article (15)
- Other (12)
- Report (10)
- Book (9)
- Study Thesis (6)
- Conference Proceeding (2)
Has Fulltext
- yes (539) (remove)
Keywords
- Öffentliche Bibliothek (21)
- Informationskompetenz (18)
- Bibliothek (13)
- Social Media (11)
- Open Access (8)
- Deutschland (7)
- Dienstleistung (7)
- Digitalisierung (7)
- Hochschulbibliothek (7)
- Information Retrieval (7)
Im Laufe ihrer Geschichte sind zahlreiche Privatbibliotheken in den Bestand der Universitäts- und Stadtbibliothek Köln aufgenommen worden. In der Regel wurden eingehende Sammlungen aufgeteilt, in die bestehende Bibliothekssystematik eingefügt und damit unsichtbar gemacht. So auch die Bibliotheken der Schwestern Mathilde und Melanie von Mevissen, die in den 1920er Jahren eingearbeitet worden sind.
Im Rahmen dieser Masterarbeit wurde das Konvolut rekonstruiert. Ausgehend von verschiedenen bibliothekarischen Quellen und die autoptische Untersuchung zahlreicher Bücher konnten über 700 Bände aus der ursprünglichen Sammlung identifiziert werden.
Die Arbeit gibt zudem Einblick in die spezifischen historischen und biografischen Verhältnisse vor denen die Schwestern ihre Bibliotheken angelegt haben und analysiert den rekonstruierten Bestand vor diesem Hintergrund.
Das Ziel der vorliegenden Arbeit ist es, Empfehlungen für Beratungsangebote zu Open Access für das Bundesinstitut für Berufsbildung zu erarbeiten. Dazu wird die Frage beantwortet, welche Beratungsangebote dazu geeignet sind, die Mitarbeitenden des BIBB bei ihren Publikationsvorhaben zu unterstützen.
Um die Frage zu beantworten, wurde unter den Mitarbeitenden des BIBB eine Befragung durchgeführt. In der Umfrage machten die Teilnehmenden Angaben zu ihren Interessen und ihrem Informationsbedarf bezüglich Open Access und verwandten Themenbereichen. Auch wurden sie zu ihrer Einschätzung bereits vorhandener Beratungsangebote sowie möglicher weiterer Angebote befragt.
Die Befragung zeigte, dass die Zielgruppe grundsätzlich großes Interesse an Beratung zu Grundlagen von Open Access, aber auch verwandten Themen hat. Auch wurde deutlich, dass unterschiedliche Formate der Beratung nötig sind, um die Mitarbeitenden des BIBB optimal zu unterstützen. Empfehlungen für die Konzeption und Durchführung von Informationsveranstaltungen, schriftlichen Informationsmaterialien sowie individueller Beratung wurden mithilfe der Fachliteratur erarbeitet.
Aus dem True Crime-Genre, das sich mit wahren Kriminalfällen und deren Hintergründen auseinandersetzt und seit zahlreichen Jahrhunderten interessiert verfolgt wird, hat sich eine umfangreiche Industrie mit internationalem Multiplattform-Erfolg entwickelt. Besonders im letzten Jahrzehnt hat die Popularität des Genres durch den Aufstieg des Erfolgsmediums Podcast einen neuen Höhepunkt erreicht. Bisher besteht jedoch eine geringe Anzahl an Forschungsarbeiten im Zusammenhang mit True Crime-Podcasts. Es ist daher notwendig, weitere empirische Befunde zu erzeugen, um die bestehende Forschungslücke zu schließen. Die vorliegende Arbeit leistet einen Beitrag zur Erforschung des Bereichs der True Crime-Podcasts und überwindet dabei bestehende Forschungslücken durch die genderspezifische Perspektive. Die Analyse der Rolle von Merkmalen der Rezipient:innen bei der Entstehung von Unterhaltung steht dabei im Fokus der Betrachtung. Diese Studie untersucht den Einfluss von Empathie und der Angst vor Kriminalität auf das Unterhaltungserlebnis von True Crime-Podcasts. Dabei wird die transaktional-dynamische Unterhaltungstheorie als Rahmenkonzept verwendet. Das Ziel dieser Arbeit ist es, Aufschluss darüber zu erlangen, welche genderspezifischen Unterschiede sich im Unterhaltungserleben von True Crime-Podcasts zeigen. Zur Beantwortung der Forschungsfrage wurde eine Online-Befragung durchgeführt. Die Ergebnisse der Studie, die auf 788 Datensätzen basieren, zeigten genderspezifische Unterschiede im Unterhaltungserleben von True Crime-Podcast-Hörer:innen. Die beiden Geschlechter wiesen sowohl im Unterhaltungserleben als auch im Ausmaß ihrer Medienempathie signifikante Unterschiede auf. Das Geschlecht erwies sich als Moderator sowohl für den Zusammenhang zwischen Medienempathie und Unterhaltungserleben als auch für die Beziehung zwischen Angst vor Kriminalität und Unterhaltungserleben. Eine erhöhte Medienempathie oder Angst vor Kriminalität führte zu einer gleichzeitigen Reduzierung des Unterhaltungserlebens. Dies zeigt, dass genderspezifische Unterschiede im Unterhaltungserleben von True Crime-Podcasts bestehen und durch Faktoren wie Medienempathie und Angst vor Kriminalität beeinflusst werden. Das Geschlecht kann einen Erklärungsbeitrag für die Beziehung zwischen diesen Faktoren und dem Unterhaltungserleben leisten.
Immer mehr Menschen wenden sich von den Nachrichten ab. Dieses Phänomen, das als News Avoidance bezeichnet wird, hat in den letzten Jahren deutlich zugenommen und beschäftigt sowohl die Wissenschaft als auch Journalist*innen aus der Praxis. Letztere haben auf der Suche nach Lösungen den Ansatz des Konstruktiven Journalismus entwickelt, der sich mithilfe konstruktiver Ansätze dem Negativ-Bias der Nachrichten entgegenstellen will. Diese Arbeit beschäftigt sich mit der Frage, wie sich der Blick aus der Praxis der konstruktiven Journalist*innen auf das Thema News Avoidance von dem der Wissenschaftler*innen unterscheidet. Zur Beantwortung dieser Frage wurde eine Literaturrecherche durchgeführt, die sowohl aktuelle wissenschaftliche Publikationen als auch Beiträge zum praktischen Diskurs wie Newsletter, Podcasts oder Blog-Beiträge umfasst.
Dieses Dokument umfasst den schriftlichen Teil meiner medienpraktischen Bachelorarbeit, deren Ziel die Konzeption und praktische Umsetzung eines Gaming-Podcasts ist. Dieser beinhaltet die Formatidee eines kritischen Gesprächs zwischen zwei Videospieler*innen mit unterschiedlichen Spielvorlieben und Expertisen. Ferner wird die Zielgruppe als Gamer*innen identifiziert und eine Analyse relevanter Wettbewerber*innen durchgeführt. Aufbauend auf den Ergebnissen all dessen wird Inhalt, Gestaltung, Technik, und Distribution des Podcasts sowie eine Strategie für einen begleitenden Instagram-Kanal konzipiert. Anschließend wird die Umsetzung beider Konzepte dokumentiert und schlussendlich reflektiert.
Insbesondere Forschende von Einrichtungen in Ländern des Globalen Südens haben bis vor zwanzig Jahren unter Zugangsbeschränkungen zu aktuellen Forschungsergebnissen, in Form hoher Subskriptionsgebühren wissenschaftlicher Fachzeitschriften, gelitten. Mit der Budapester Open Access Initiative von 2002 wurde die Hoffnung auf eine Verbesserung der Zugangsverhältnisse sowie der Wahrnehmung von wissenschaftlichen Publikationen aus Ländern des Globalen Südens geweckt. Das Ziel der vorliegenden Arbeit ist es, am Beispiel Kolumbiens als ein Land des Globalen Südens, zu untersuchen, ob positive Auswirkungen der Open Access-Maßnahmen auf den Publikationsoutput wissenschaftlicher Erkenntnisse, den Zugang zu Literatur und die Wahrnehmung des Publikationsoutputs empirisch belegbar sind. Dazu wird die folgende Forschungsfrage gestellt: Welche Auswirkungen haben die Open Access-Maßnahmen Kolumbiens auf die Zugangsmöglichkeiten kolumbianischer Autor:innen zu Artikeln impact-starker Zeitschriften und die Wahrnehmung kolumbianischer Publikationen von 2002 bis 2022 gehabt? Um die Forschungsfrage zu beantworten, wurde eine quantitative Literaturstudie in der Datenbank Scopus zum Publikationsoutput Kolumbien von 2002 bis 2022 durchgeführt. Speziell wurden Daten in Bezug auf die Entwicklung des Open Access-Publikationsaufkommens Kolumbiens inklusive und exklusive internationaler Mehrautor:innenschaften erhoben. Zusätzlich wurden die Daten der Referenzen und die Zitationsrate der meistzitierten kolumbianischen Open Access-Veröffentlichungen ermittelt sowie der Anteil der kolumbianischen Publikationen in den Referenzen des meistzitierten, internationalen Publikationsaufkommens von 2002 bis 2022 gemessen und im Hinblick auf das zeitliche Auftreten von Open Access-Maßnahmen interpretiert.
Die ergriffenen Open Access-Maßnahmen Kolumbiens innerhalb der vergangenen zwei Jahrzehnte korrelieren mit einer kontinuierlichen Wachstumsrate des Open Access-Publikationsaufkommens sowie einem erhöhtem Zugang zu Artikeln impact-starker Zeitschriften und einer gestiegenen Wahrnehmung des kolumbianischen wissenschaftlichen Publikationsoutputs. Aufgrund der zum Erstellungszeitpunkt der vorliegenden Arbeit kürzlich beschlossenen nationalen Open Science Policy werden weiterführende Studien zur Auswirkung auf den Publikationsoutput Kolumbiens empfohlen.
Die vorliegende Arbeit beschäftigt sich mit der durch Social Media ausgelösten „Fear of missing out“ (FoMO) und verfolgt das Ziel, auf Basis einer Literaturrecherche die Auswirkungen von FoMO auf das psychische Wohlbefinden in der frühen und mittleren Adoleszenz zu untersuchen. Hierfür werden zunächst das Phänomen FoMO erklärt und dessen Relevanz in der betrachteten Altersphase ermittelt. Darauf aufbauend zeigt diese Arbeit die Zusammenhänge von FoMO und Social Media auf und erläutert die Einflüsse von FoMO auf das psychische Wohlbefinden. FoMO ist gekennzeichnet durch die Angst, andere könnten lohnendere Erfahrungen machen als man selbst. Zentrale Erkenntnisse dieser Arbeit sind, dass FoMO und Social Media in einem engen Zusammenhang stehen und FoMO das psychische Wohlbefinden durch Gefühle von Stress, Niedergeschlagenheit und Unzulänglichkeit stark beeinträchtigten kann.
Verbesserung der automatischen Dokument-Klassifikation für den Discovery Service LIVIVO von ZB MED
(2023)
Diese Arbeit beschreibt, wie eine Grundlage geschaffen wird, um die Dokumentenklassifikation der Suchmaschine LIVIVO durch eine Eigenentwicklung der ZB-Med zu ersetzen. Das bisher eingesetzte
System basiert auf einer proprietären Software der Averbis GmbH und bietet keine Möglichkeit, diese von ZB-Med anpassen oder erweitern zu lassen. Damit die Klassifikation der Dokumente innerhalb der Datenbank, der Suchmaschine LIVIVO, verbessert werden kann, soll ein neues System entwickelt werden.
Um dieses Ziel erreichen zu können, konzentriert sich diese Arbeit auf eine explorative Analyse der vorhandenen Daten sowie auf die Erstellung erster Klassifikationsmethoden und den damit verbundenen Aufbau eines Textkorpus. Diese neu erstellten Methoden basieren auf existierenden Klassifikationsmodellen wie Stochastic Gradient Descent Classifier (SGDC), Term-Frequenzy Inverse-Document-Frequenzy (TF-IDF) und Latent Dirichlet Allocation (LDA). Die Ergebnisse dieser Modelle
werden diskutiert und evaluiert. Die erstellten Leistungskurven der Modelle und Textkorpi können somit als Vergleich, sowie Grundlage für weitere Arbeiten am System verwendet werden.
Die Zahl der wissenschaftlichen Publikationen steigt von Jahr zu Jahr. Der technologische Fortschritt hat es den Forschenden erleichtert, Daten zu sammeln, zu analysieren und zu verarbeiten. Aufgrund von Faktoren wie dem starken Wettbewerb um Forschungsgelder, Arbeitsplätze und Anerkennung wird die Anzahl und Reichweite von Publikationen als ein wichtiger Indikator für die Leistung und den Erfolg von Wissenschaftlern angesehen. Die Zunahme von Publikationen kann aber auch zu einer Zunahme von unzureichend überprüften oder nicht reproduzierbaren Ergebnissen führen.
Die Integrität der wissenschaftlichen Literatur wird durch das Zurückziehen (engl. Retraction) fehlerhaft veröffentlichter Publikationen gewahrt. Die Kennzeichnung zurückgezogener Artikel in online verfügbaren Quellen ist daher von großer Bedeutung. In dieser Ausarbeitung wird die im Suchportal LIVIVO verfügbare Literatur auf zurückgezogene Artikel untersucht. Retraction Watch, ein amerikanischer Blog, bietet eine Datenbank zurückgezogener Artikel mit fast 40.000 Einträgen. Um die beiden Datensätze miteinander vergleichen zu können, wird eine lokale Datenbankanwendung entwickelt, die einen Abgleich und eine anschließende Analyse ermöglicht. Für die Anreicherung der Metadaten für LIVIVO wird empfohlen, den Digital Object Identifier (DOI), das Datum und die PubMedID, unter der der zurückgezogene Artikel veröffentlicht wurde, mit aufzunehmen.
Der Abgleich gibt einen ersten Eindruck über das Vorhandensein zurückgezogener Artikel im Suchportal. Es wurden 14.206 Einträge identifiziert, wobei in den letzten Jahren ein stetiger Anstieg in der Anzahl zu verzeichnen ist.
Das Ziel der Studie ist, einen Beitrag zur Analyse der Einflussmöglichkeiten von Gamification-Kampagnen auf die Meinung der Rezipierenden bezüglich einer Marke beizusteuern. Der Kontext der Studie bewegt sich dabei im Schnittpunkt zwischen dem Marketing, dem Spieldesign und der Psychologie. Die Forschungsfrage lautet: Wie beeinflussen Gamification-Kampagnen im Marketing die Markenwahrnehmung?
Zur Beantwortung der Forschungsfrage wurde ein Leitfadenfragebogen erstellt, mit dem zehn Testpersonen, welche vorher anhand einer Klassifizierungsmatrix in fünf Befragtentypen geteilt wurden, befragt wurden. Die Erstellung des Leitfadens erfolgte dabei anhand eines Abhängigkeitskonstrukts, welches aus der Literatur abgeleitet wurde. Als Forschungsgegenstand wurde den Teilnehmenden eine Gamification-Kampagne sowie ein Werbespot gezeigt, auf dessen Basis die Bindung zur Kampagne und die Markenwahrnehmung erfragt wurde.
Die Analyse der Ergebnisse zeigt, dass Gamification-Kampagnen im Werbeverständnis der Personen nicht präsent sind, aber das Engagement der Rezipierenden mit der Kampagne, dem gezeigten Produkt und der Marke fördern. Außerdem wird die behandelte Marke in Gamification-Kampagne verstärkt mit emotionalen Eigenschaften verbunden, was eine positive Markenwahrnehmung fördern kann.
Eignen sich kleine Bibliotheken für Citizen Science-Projekte? Verschiedene Aspekte verbergen sich hinter dieser kurzen Eingangsfrage: Was sind kleine Bibliotheken? Was bedeutet Citizen Science? Eignen sich Bibliotheken generell für entsprechende Projekte und wenn ja, warum sollten sich kleine Bibliotheken ggfs. nicht oder eben doch besonders eignen? Die vorliegende Masterarbeit möchte diese Fragestellungen anhand des Beispiels von Kreisarchiv und Landeskundlicher Bibliothek des Märkischen Kreises beantworten.
Dazu werden zunächst die Begrifflichkeiten definiert. Neben Citizen Science gilt es Vokabeln wie Citizen Humanities oder Crowdsourcing zu diskutieren. Bevor ausgewählte Projekte als Best Practices beleuchtet werden, untersucht die Arbeit, ob sich Bibliotheken und vergleichbare Wissenseinrichtungen als Orte für Citizen Science eignen und ob die Dokumente aus den Magazinen generell als lohnenswert für eine Erforschung durch die interessierte Öffentlichkeit einzustufen sind.
Anschließend befragt die vorliegende Ausarbeitung ausgewählte Bestände von Landeskundlicher Bibliothek und Kreisarchiv des Märkischen Kreises auf ihr Potential für etwaige Citizen Science-Projekte und überprüft diese auf ihre Durchführbarkeit mit den vorhandenen Mitteln der Beispieleinrichtung. In einem Fazit werden die Erkenntnisse dieser vergleichenden Betrachtung bewertet und vorgestellt, welches Learning diese Machbarkeitsstudie vergleichbaren kleinen Einrichtungen anbieten kann.
Die Datenschutzbestimmungen rund um die Datenschutzgrundverordnung, das Telekommunikations-Telemedien-Datenschutz-Gesetz und die App-Tracking Transparenz unter dem Betriebssystem iOS 14.5 von Apple haben Werbetreibende in den letzten fünf Jahren vor neue Herausforderungen gestellt und Werbemaßnahmen auf Social Media stark verändert. Insbesondere der Umgang mit Cookies und personenbezogenen Daten wurde stark beschränkt. Expert:innen sind sich einig, dass das Cookie-Tracking bald der Vergangenheit angehören und das Cookieless-Tracking die Online-Werbewelt dominieren wird. Heutzutage gibt es vielfältige Möglichkeiten, mit denen Werbetreibende ihre Zielgruppen ohne große Streuverluste und Cookies entlang des Marketing-Funnels erreichen können. Mit dem serverseitigen Tracking über die Conversion API bietet der Konzern Meta Platforms eine davon. Es bedarf jedoch weiterhin der aktiven Zustimmung der Nutzer:innen, sodass Datenlücken entstehen können und Retargeting-Zielgruppen dadurch nur eingeschränkt einsetzbar sind. Eine alternative Tracking-Methode ist das Arbeiten ausschließlich mit plattformeigenen Daten von Meta. Der Vorteil liegt darin, dass keine zusätzliche Tracking-Zustimmung durch die Nutzer:innen benötigt wird und somit keine Datenlücken entstehen. Auf der anderen Seite können keine Websitedaten analysiert und Daten der Zielgruppe eingesehen werden, das möglicherweise dazu führt, dass wichtige Erkenntnisse im finalen Kaufprozess auf der Website verloren gehen. Aktuell gibt es keine Tracking-Methode, die nur Vorteile mit sich bringt. Vielmehr müssen Werbetreibende durch strategisches Testen individuell entscheiden, welche Tracking-Methoden für ihr Unternehmen am besten geeignet sind. Die vorliegende Arbeit definiert dabei konkrete Handlungsempfehlungen, die Werbetreibende bei der Auswahl der Tracking-Methode für einen strategischen Werbeauftritt auf Meta unterstützen.
Die vorliegende Arbeit befasst sich mit dem Thema Informationskompetenz unter dem spezifischen Blickwinkel des Lehramtsstudiums. Dazu wurden die Themenkomplexe Lehramt und Informationskompetenz theoretisch aufgearbeitet. Durch eine systematische Literaturrecherche wurden aktuelle Erkenntnisse, Bedarfe und Desiderate im Bereich Lehramt herausgearbeitet und Implikationen für zukünftige Bedarfe für das Lehramtsstudium sowie bibliothekarische Angebote für die Zielgruppe Lehramtsstudierende abgeleitet.
Die hier vorgelegte Masterarbeit hat die Zielsetzung, die bibliothekswissenschaftliche Rezeption von LGBTIQ* aus einer interkulturellen Perspektive zu untersuchen. In einem Vergleich der beiden Länder Deutschland und USA wird mithilfe einer Literatur- bzw. qualitativen Dokumentenanalyse belegt, dass das Thema in den USA seit mehreren Jahrzehnten eine breite Resonanz erfährt, wohingegen es im deutschen bibliothekswissenschaftlichen Diskurs praktisch bis heute nicht existiert. In der Analyse wie auch im Rahmen eines gegenüberstellenden Vergleichs wird deutlich gemacht, dass die wissenschaftliche Beachtung oder eben Nichtbeachtung Konsequenzen sowohl für LGBTIQ*-Nutzende als auch LGBTIQ*-Bibliotheksschaffende hat und die Bereitstellung von Angeboten und Dienstleistungen für LGBTIQ*-Personen fördert oder hemmt. Mithilfe einer selbstentwickelten Modellierung wird anschließend gezeigt, welche Dynamiken hinter dieser unterschiedlichen Rezeption wirken und welche Gründe dafür verantwortlich sein können, dass beim Thema LGBTIQ* und Bibliothek in Deutschland nach wie vor eine Art Leerstelle herrscht.
Die vorliegende Bachelorarbeit befasst sich mit der Frage, inwiefern öffentliche Bibliothekare in Kinofilmen und Fernsehserien sich vom Berufsbild deutscher und internationaler Bibliotheksverbände unterscheiden. Ziel der Arbeit ist es, sowohl Gemeinsamkeiten als auch Unterschiede zu identifizieren, die zwischen den stereotypischen Verfilmungen und der tatsächlichen beruflichen Rolle von Bibliothekaren auftreten. Insgesamt werden acht Kinofilme und elf Fernsehserien, in denen öffentliche Bibliothekare als Charaktere vorkommen, im Zeitraum der letzten fünf Jahre untersucht. Die Ergebnisse der formalen und inhaltlichen Kategorien stehen dabei im Mittelpunkt der Analyse, da sie dazu beitragen, die Bedeutung einer differenzierten Darstellung in den Medien zu betonen. Sie liefert zudem Impulse für weitere Forschungsansätze zur Repräsentation von Berufen und deren Einfluss auf die öffentliche Wahrnehmung.
Compact Discs sind Datenträger, die in großer Zahl in den Beständen von Gedächtnisorganisationen vorkommen. Weil die Datenträger nur begrenzt haltbar sind, entwickelt sich immer stärker die Notwendigkeit, die Daten von den Trägern zu trennen und gesondert zu archivieren. Die Arbeit gibt einen Überblick darüber, welche Institutionen das Problem auf welche Art und Weise angehen und schlägt Perspektiven für die Zukunft vor. Im theoretischen Teil wird der Begriff „Gedächtnisorganisation“ geklärt, es wird die Bewahrungsproblematik von CDs ausgeführt und es werden Migration und die Erstellung von Disc Images zur Emulation als Archivierungsoptionen erläutert. Im Praxisteil werden mithilfe von Interviews und Literaturarbeit verschiedene Einrichtungen und deren individuelle Strategien vorgestellt. Es zeigt sich deutlich, dass die Langzeitarchivierung optischer Datenträger aktuell noch ein sehr individuelles Thema ist, das Einrichtungen primär aus eigener Motivation angehen und bislang nur wenig Zusammenarbeit stattfindet, um gemeinsame Lösungen zu entwickeln. Abschließend werden Vorschläge formuliert, was unternommen werden kann, um die Langzeitarchivierung in Deutschland zu vereinheitlichen und zu rationalisieren.
Schulungen zu Predatory Publishing: Identifikation von Best Practices an deutschen Universitäten
(2023)
Predatory Publishing ist eine aus dem Open Access entstandene Geschäftspraktik. Verlage machen sich die Unwissenheit von Forscher*innen zunutze, um sich selbst zu bereichern. In der folgenden Ausarbeitung wird untersucht, wie verbreitet Bibliotheken zu Predatory Publishing aufklären und welche Inhalte und Methoden sich als Best Practice für Informationsangebote anbieten. Inhaltlich überschneiden sich die Angebote in vielen Punkten und je nachdem wie umfangreich die Angebote geplant sind, werden Informationen mit Beispielen vertieft. Der gängige didaktische Aufbau für Workshops besteht aus einem theoretischen Teil und einer Übung, um das Gelernte anzuwenden.
Der digitale Wandel, getrieben durch die Evolution von „New Media“ mit ihren interaktiven, multimedialen Merkmalen und globaler Zugänglichkeit, hat nachhaltige Auswirkungen auf die Bereiche Journalismus, Unterhaltung und Wissenschaftskommunikation hinterlassen. Innerhalb dieses Rahmens dienen Podcasts als zugängliche, offene Plattform zur Verbreitung wissenschaftlicher Informationen und zur Förderung interdisziplinärer Diskussionen, wobei Herausforderungen im Hinblick auf die auditiven Eigenschaften und die Notwendigkeit evidenzbasierter Kommunikation bestehen. Das Hauptziel dieser Studie besteht darin, die jüngsten Fortschritte in KI-gesteuerten Transkriptionsverfahren zu nutzen, um effiziente und hochwertige Transkriptionen zu realisieren. Darüber hinaus werden neue Ansätze zur Steigerung der Auffindbarkeit, Zugänglichkeit und Verbreitung wissenschaftlicher Inhalte diskutiert. Für diese Studie wurden Audio-Daten aus dem bilingualen Common Voice-Datensatz und dem englisch-sprachigen GigaSpeech-Datensatz verwendet, um automatisierte Transkriptionen zu erstellen. Die Transkriptionen wurden anschließend mithilfe von Metriken wie der Wortfehlerrate und des Jaro-Winkler-Ähnlichkeitsmaß bewertet. Die Ergebnisse dieser Untersuchung verdeutlichen, dass die Genauigkeit des ASR-Modells „Whisper“ von OpenAI von verschiedenen Faktoren abhängig ist. Hierzu zählen die Sprache, verschiedene Dialekte, Akzente, Altersgruppen und Themengebiete. Im Gesamten betrachtet konnte die Transkription von englischen im Vergleich zu deutschen Daten präziser durchgeführt werden. Trotz gelegentlicher Fehler zeigten die durch ASR generierten Transkriptionen eine signifikante Ähnlichkeit zur Ground Truth, was auf ihr Potenzial für die Transkription von Podcasts hinweist. Ein Vergleich verschiedener Modellgrößen ergab, dass größere Modelle eine überlegene Leistung erbrachten. Diese robusten Ergebnisse legen nahe, dass Transkriptionen eine sinnvolle Ergänzung zu den vorhandenen Metadaten von Podcasts darstellen und zur Verbesserung von Retrieval-Anwendungen genutzt werden können.
Des Weiteren bieten Transkriptionen eine solide Grundlage für die Anwendung fortgeschrittener Methoden des NLP zur Extraktion entscheidender Informationen, wie beispielsweise Verweise und Entitäten, welche in ein vernetztes System, wie Knowledge Graphs, integriert werden können, um Podcast-Inhalte auf effiziente Weise zu strukturieren und Verknüpfungen zu anderen Wissensquellen herzustellen.
This thesis aims to extend an existing Open Educational Resource (OER), which is available as a GitHub repository, and provide an organized introduction to basic machine learning (ML) concepts and algorithms. Further models, followed by structured metadata for each object, will be included while adhering to the contribution guidelines of the OER and following the CC license. The Machine-Learning-OER Basics repository intends to provide a wide range of benefits by enabling diverse users to apply and distribute machine learning algorithms. The goal of this digital collection is to fill the existing gap for instructional material on using machine learning in OER as well as make it easier to learn ML concepts effectively. These ML models are developed using the programming language Python and the library scikit-learn, among other standard libraries. Jupyter Notebook will make it straightforward for the user to explore the code. In order to apply the models to various practical scenarios, a non-specific data set is selected. This work is considered a solution approach in that it includes adding classification models.
A performance comparison of the models is conducted. This comparative analysis evaluates the efficiency of each model. The examination includes various metrics for measurement. This work serves as a written extension, providing comprehensive background information on the algorithms utilized within the repositories and the performance comparison.
Für die einfache Literaturrecherche von Fachinformationen bietet die ZB MED eine Literaturdatenbank namens LIVIVO an. Um eine thematische Suche zu ermöglichen, befasst sich diese Bachelorarbeit mit der Themenklassifikation der in der Datenbank vorhandenen Publikationen. Das Ziel der Arbeit besteht darin, den Korpus für eine automatisierte Klassifizierung aufzubereiten, um eine relevante Klasseneinteilung zu erzielen. Ausgehend von der Annahme, dass eine Textklassifizierung durch spezifische Terme und Schlüsselwörter gezieltere und aussagekräftigere Ergebnisse liefern kann, wird eine themenspezifische Aufbereitung mithilfe von Wissensorganisationssystemen (Thesauri) eingebunden. Hierzu wird im Vorhinein eine automatisierte Spracherkennung der Publikationen implementiert. Nach der Indexierung der Schlüsselwörter in den Dokumenten werden zwei statistische Klassifikationsmodelle für die Klassifizierung angewandt. Hierzu gehört die Latent Dirichlet Allocation, sowie der Stochastic Gradient Descent Classifier. Abschließend wird die automatische Schlagwortextraktion mit einer intellektuellen Themenanalyse verglichen und die Performance der Klassifizierung mit den aufbereiteten In Input-Daten auf eine Verbesserung hin analysiert.