Refine
Year of publication
- 2017 (6) (remove)
Document Type
- Bachelor Thesis (4)
- Master's Thesis (2)
Keywords
- Suchmaschine (2)
- Autosuggestion (1)
- Benutzerschulung (1)
- Data Mining (1)
- Informationskompetenz (1)
- Lemmatisierung (1)
- Mitarbeiterbefragung (1)
- Phrasenextraktion (1)
- Politik (1)
- Referenzrahmen Informationskompetenz (1)
Die vorliegende Bachelorarbeit hat die Entwicklung eines Veranstaltungskonzepts zum Ziel, welches zur Vermittlung von Suchmaschinenkompetenz an Nutzer Öffentlicher Bibliotheken verwendet werden kann. Ausgangsbasis dafür ist die Annahme, dass Suchmaschinenkompetenz als Teil von Informationskompetenz zu sehen ist und somit ins Aufgabenspektrum Öffentlicher Bibliotheken fällt. Im Verlauf der Arbeit wird Klingenbergs Referenzrahmen Informationskompetenz vorgestellt und Suchmaschinenkompetenz in selbigem verortet. Neben Theorie zur Schulungskonzeption werden suchmaschinentechnische Grundlagen erörtert, die zur Vermittlung von Suchmaschinenkompetenz vonnöten sind. Das Schulungsgrobkonzept umfasst drei Schulungen auf dem Referenzrahmen Informationskompetenz entnommenen Niveaustufen: A, B2 und C1, also Viertklässler, Zehntklässler und Erwachsene. Das Grobkonzept ist universell gestaltet und kann auch von kleinen Öffentlichen Bibliotheken mit geringem Veranstaltungsetat umgesetzt werden.
Analysing the systematics of search engine autocompletion functions by means of data mining methods
(2017)
In the internet era, the information that can be found about politicians online can influence
events such as the results of elections. Research has shown that biased search rankings can
shift the voting preferences of undecided voters. This shows the importance of studying
online search behaviour, especially in the pre-elections phase, when search results can
have a particular influence on the future political scene of a country.
This master thesis aimed to study the behaviour of online search engines in a period before
the German federal election in 2017. The aim was to ascertain if there is any pattern to be
found in the auto-suggestions for searches related to politicians.
In order to gather data for this experiment, a crawler browsed search engine web pages,
input a name and a surname of a politician, and saved that together with all autosuggestions
from the search engine. The autosuggestions were prepared for the analysis and
divided into semantic groups with the help of clustering algorithms.
Different statistical methods, such as correlation analysis, regression analysis, and clustering
were used to identify patterns in the data. The research showed that there are
no particularly strong patterns in the autosuggestions for searches related to politician’s
names. Only moderate dependence was found between gender and personal topics, and
showed that a higher amount of personal information autosuggestions correspond more
to female politicians.
Die vorliegende Bachelorarbeit beschäftigt sich mit der Konzeptionierung und Umsetzung des Relaunchs der Website Cucuron.de. Hierbei handelt es sich um einen privaten Webauftritt, auf dem der Betreiber sein Ferienhaus im Ort Cucuron in Südfrankreich vorstellt. Ziel der Website ist es, potentielle Gäste über das Angebot zu informieren. Der Relaunch umfasst die technische Durchführung eines selbsterstellten Layouts nach aktuellen Webstandards, wie HTML5 und CSS3, samt responsiver Gestaltung zur optimalen Darstellung der Website auf sämtlichen Endgeräten. Dazu zählen Smartphones, Tablets und Desktop-Computerbildschirme. Schließlich beschreibt die Bachelorarbeit die Implementierung des erstellten Layouts in das Content Management WordPress. Um Nutzen und Ziel von Cucuron.de entsprechend zu erfüllen, geht der praktischen Umsetzung zunächst eine Zielgruppen- sowie Konkurrenzanalyse voran, womit die Anforderungen des Relaunchs definiert werden. Zudem setzt sich diese Bachelorarbeit mit den Möglichkeiten der Integration von Social Media-Kanälen auseinander, womit eine Bindung zur Zielgruppe sowie eine Reichweitenvergrößerung erreicht werden kann.
Die vorliegende Bachelorarbeit beschäftigt sich mit der Konzeption und medienpraktischen Umsetzung einer Website für einen fiktiven Kunden mit einer fiktiven Dienstleistung. Unter www.marcel-greve-ba.de kann die Website eingesehen werden. Der Fokus des Projekts liegt auf einer Analyse der Eigenschaften der Zielgruppe des Kunden. Aus diesen Eigenschaften werden die inhaltlichen und optischen Anforderungen an die Website und die Social-Media-Profile abgeleitet. Anschließend werden Entwürfe zur Website-Struktur und des späteren Designs angefertigt. Die technische Umsetzung erfolgt mit dem Content Management System (CMS) Wordpress. Im Zuge dessen wird erläutert, welche Plugins verwendet und welche Änderungen an der Formatierung vorgenommen wurden. Zusätzlich wird eine Social-Media-Strategie ausgearbeitet.
Text Mining bietet die Möglichkeit, große Textmengen durch automatisierte Verfahren zu analysieren. Die vorliegende Arbeit beschäftigt sich mit der Anwendung und Evaluation solcher Methoden für die spezielle Textform freier Antworten aus Mitarbeiterbefragungen. Dabei werden verschiedene Techniken aus den drei Bereichen Phrasenextraktion, Sentimentanalyse und Kategorisierung dargestellt und an einer konkreten Umfrage angewendet. Die Ergebnisse werden jeweils durch Abgleich mit manuellen Ergebnissen bzw. durch manuelle Bewertungen evaluiert und die Resultate untereinander verglichen. Die genutzten Verfahren sollten ohne spezifische Trainingsdaten oder Projektinformationen anwendbar sein und sich somit auch für andere Mitarbeiterbefragungen eignen.
Die Phrasenextraktion wird auf drei verschiedene Weisen durchgeführt, wobei Part-of-Speech (POS)-Chunking, Stoppwortbegrenzung und Kookkurrenzen genutzt werden. Die Untersuchungen zeigen, dass mit dem POS-Chunking präziser die relevantesten Phrasen aus längeren Texten ermittelt werden können. Die Methode der Stoppwortbegrenzung extrahiert dagegen eine größere Vielfalt relevanter Phrasen auch aus kürzeren Texten. Manuelle Einschätzungen der Extraktionsergebnisse bewerten die Methode mit POS-Chunking am besten. Darüber hinaus wird eine automatisierte Zusammenfassung semantisch ähnlicher Phrasen durchgeführt, wodurch sich leichte Verbesserungen einiger Evaluationsergebnisse zeigten.
Für die Sentimentanalyse der freien Antworten wird eine Erweiterung eines bestehenden Verfahrens aus dem Social Media-Bereich dargestellt. Hierzu werden der Methode vier Regeln hinzugefügt, welche die Sentimentbewertung aufgrund bestimmter Syntaxformen in den freien Antworten verändern. Die Evaluation zeigt, dass drei der vier Regeln dazu beitragen, dass sich die automatisierte Bewertung manuellen Bewertungen annähert.
Die Kategorisierung wird durch die beiden Topic Modeling-Methoden Latent Dirichlet Allocation (LDA) und Non-negative Matrix Factorization (NMF) durchgeführt. NMF erreichte bei dem Abgleich mit einer manuellen Kategorisierung höhere Übereinstimmungen und zeichnete sich auch durch eine bessere Abgrenzung der Thematiken sowie eine bessere Interpretierbarkeit aus.
Die Text Mining-Methoden und deren Evaluationen werden für diese Arbeit in der Programmiersprache Python umgesetzt. Außerdem werden die Text Mining-Resultate in die Datenvisualisierungssoftware Tableau eingebunden.
In der vorliegenden Arbeit wird ein Einblick in Eignung und Unterschiede verschiedener Text Mining-Methoden in Bezug auf freie Antworten in Mitarbeiterbefragungen gegeben. Darüber hinaus wird dargestellt, dass auch spezifische Anpassungen an diese Textform möglich sind. Zusätzlich werden diverse Optimierungsansätze aufgezeigt, die den noch großen Weiterentwicklungsbedarf in diesem Bereich verdeutlichen.
Suchmaschinen sind ein fester Bestandteil des täglichen Lebens geworden. Weil sie so einen Stellenwert haben, ist es heutzutage wichtig zu hinterfragen, wie die Ergebnisse zustande kommen und ob diese beeinflusst werden können. Schließlich gibt es eine gesamte Marketing-Disziplin, die sich darauf spezialisiert hat. Diese Disziplin nennt sich Suchmaschinenoptimierung. Um der Manipulation durch diese und einer Überoptimierung von Seiten zu entgehen, verbessern Suchmaschinenbetreiber im Gegenzug ständig ihre Bewertungskriterien. Dadurch sind die Algorithmen inzwischen sehr komplex geworden. In dieser Arbeit soll am Beispiel von Google getestet werden, wie effektiv die Qualitäts--Algorithmen von Suchmaschinen wirklich sind, wie wichtig die Kenntnisse über Ranking-Faktoren überhaupt sind, um Erfolg zu haben und wie einfach es sein kann Ergebnisse von Suchmaschinen zu manipulieren.