Die Nutzung von Suchmaschinen ist im Alltag moderner Gesellschaften fest implementiert und gilt heute als eines der Fundamente digitaler Informationsbeschaffung.
Diverse Studien schreiben digitalen Informationsanbietern einen soziotechnologischen Charakter zu, welcher potenziell dazu in der Lage ist durch ein Konglomerat feinjustierter Algorithmen Gesellschaften zu beeinflussen und eine Steuergröße in demokratischen Prozessen abzubilden. Die vorliegende Bachelor-Thesis belegt durch die Analyse diverser Nationen mithilfe der Datamining-Umgebung RapidMiner die ungleiche Darstellung von Ethnien in Suchvervollständigungen durch Textminingverfahren wie TF-IDF-Gewichtung, Erhebung von Termhäufigkeiten und der Durchführung einer Sentimentanalyse.
Elektronische Medien stellen für Bibliotheken ein Bestandssegment mit zunehmender Bedeutung dar. Sie weisen Merkmale auf, die verschiedene Herausforderungen schaffen. Die Präsentation von elektronischen Ressourcen erfolgt in digitalen Bibliotheken, Discovery-Systemen mit einem zentralen Suchindex oder durch Ansätze der Repräsentation im Bibliotheksgebäude. Von bibliothekarischen Nachweissystemen wird erwartet, dass diese ebenso gut funktionieren wie vergleichbare Internetsuchmaschinen.
Aufgrund der großen Menge an Daten gibt es verschiedene Faktoren, die die Discoverability (Auffindbarkeit) – und damit die Nutzbarkeit – von E-Medien einschränken können, sodass Ansätze zur Verbesserung dieser eingesetzt werden müssen. In einer Reihe von Bereichen sind hier Weiterentwicklungen möglich.
Query Suggestion mit Siri
(2019)
Suchanfragen und automatische Vorschläge zu diesen, wenn der Nutzer die Anfrage gerade noch eintippt, gehören heutzutage zum Standard. Das nicht nur bei Suchen im Internet, sondern auch mithilfe von integrierten Assistenten an PC oder auf Mobilgeräten, wie Smartphones oder Tablets. Einer dieser persönlichen Assistenten ist Siri, eine Software auf iOS-Geräten des Technologiekonzerns Apple. Siri ist hauptsächlich bekannt dafür, als Sprachassistent auf gesprochene Anfragen zu reagieren. Allerdings bietet Siri auch eine Suchfunktion auf dem Homescreen des Geräts an, in die Suchen eingetippt werden können. Auch hier werden Vorschläge gemacht, die die Eingabe während des Schreibens automatisch vervollständigen. Dabei ist aber nicht klar, woher diese stammen. Gut denkbar ist eine Kooperation mit einem etablierten Anbieter einer Web-suchmaschinen. Aber klare Aussagen, von Apple selbst, finden sich nicht. Lässt sich dies eventuell auf experimentellem Weg ermitteln? Um sich der Lösung dieser Fragestellung zu nähern, stelle diese Bachelorarbeit die Umsetzung eines Versuchsaufbaus dar, bei dem über einen vierwöchigen Zeitraum definierte Suchanfragen an die Web-suchmaschinen Google, Bing, DuckDuckGo und an die Siri-Suche gestellt wurden. Durch Analysemethoden, wie unter anderem Rank-biased overlap (RBO), sollten so Gemeinsamkeiten ermittelt werden, die gegebenenfalls auf einen konkreten Partner schließen lassen. Zwar zeigten die Vergleichsmethoden durchaus Unterschiede auf, ein klares Ergebnis in Bezug auf eine der betrachteten Suchmaschinen, konnte allerdings nicht erzielt werden.
Analysing the systematics of search engine autocompletion functions by means of data mining methods
(2017)
In the internet era, the information that can be found about politicians online can influence
events such as the results of elections. Research has shown that biased search rankings can
shift the voting preferences of undecided voters. This shows the importance of studying
online search behaviour, especially in the pre-elections phase, when search results can
have a particular influence on the future political scene of a country.
This master thesis aimed to study the behaviour of online search engines in a period before
the German federal election in 2017. The aim was to ascertain if there is any pattern to be
found in the auto-suggestions for searches related to politicians.
In order to gather data for this experiment, a crawler browsed search engine web pages,
input a name and a surname of a politician, and saved that together with all autosuggestions
from the search engine. The autosuggestions were prepared for the analysis and
divided into semantic groups with the help of clustering algorithms.
Different statistical methods, such as correlation analysis, regression analysis, and clustering
were used to identify patterns in the data. The research showed that there are
no particularly strong patterns in the autosuggestions for searches related to politician’s
names. Only moderate dependence was found between gender and personal topics, and
showed that a higher amount of personal information autosuggestions correspond more
to female politicians.
Diese Arbeit befasst sich mit der Bedeutung von Suchmaschinenoptimierung für öffentliche Bibliotheken. Für ein besseres Verständnis der Optimierungen wird die grundlegende Funktionsweise von Suchmaschinen erläutert und ein Einblick in den Aufbau der zwei häufigsten Websitemodellen bei Bibliotheken gegeben. Es wird gezeigt werden, dass die Ziele eine Suchmaschinenoptimierung weitreichender sind, als nur in der Google Trefferliste auf Platz eins zu stehen und dass die Verwirklichung dieser Ziele einer umfassenden Planung bedarf. Die verschiedenen Punkte, die bei der Planung beachtet werden sollten, werden aufgeführt und erläutert. Abschließend werden die praktischen Maßnahmen für die Optimierung der Website ausführlich dargestellt und es werden beispielhafte Einsatzmöglichkeiten für Bibliotheken genannt.
Die vorliegende Bachelorarbeit hat die Entwicklung eines Veranstaltungskonzepts zum Ziel, welches zur Vermittlung von Suchmaschinenkompetenz an Nutzer Öffentlicher Bibliotheken verwendet werden kann. Ausgangsbasis dafür ist die Annahme, dass Suchmaschinenkompetenz als Teil von Informationskompetenz zu sehen ist und somit ins Aufgabenspektrum Öffentlicher Bibliotheken fällt. Im Verlauf der Arbeit wird Klingenbergs Referenzrahmen Informationskompetenz vorgestellt und Suchmaschinenkompetenz in selbigem verortet. Neben Theorie zur Schulungskonzeption werden suchmaschinentechnische Grundlagen erörtert, die zur Vermittlung von Suchmaschinenkompetenz vonnöten sind. Das Schulungsgrobkonzept umfasst drei Schulungen auf dem Referenzrahmen Informationskompetenz entnommenen Niveaustufen: A, B2 und C1, also Viertklässler, Zehntklässler und Erwachsene. Das Grobkonzept ist universell gestaltet und kann auch von kleinen Öffentlichen Bibliotheken mit geringem Veranstaltungsetat umgesetzt werden.
Analyse der Übertragbarkeit allgemeiner Rankingfaktoren von Web-Suchmaschinen auf Discovery-Systeme
(2018)
Ziel dieser Bachelorarbeit war es, die Übertragbarkeit der allgemeinen Rankingfaktoren,
wie sie von Web-Suchmaschinen verwendet werden, auf Discovery-Systeme zu analysieren.
Dadurch könnte das bisher hauptsächlich auf dem textuellen Abgleich zwischen Suchanfrage
und Dokumenten basierende bibliothekarische Ranking verbessert werden.
Hierfür wurden Faktoren aus den Gruppen Popularität, Aktualität, Lokalität, Technische
Faktoren, sowie dem personalisierten Ranking diskutiert. Die entsprechenden Rankingfaktoren
wurden nach ihrer Vorkommenshäufigkeit in der analysierten Literatur und der daraus
abgeleiteten Wichtigkeit, ausgewählt. Von den 23 untersuchten Rankingfaktoren sind 14 (61 %) direkt vom Ranking der
Web-Suchmaschinen auf das Ranking der Discovery-Systeme übertragbar. Zu diesen zählen
unter anderem das Klickverhalten, das Erstellungsdatum, der Nutzerstandort, sowie die Sprache.
Sechs (26%) der untersuchten Faktoren sind dagegen nicht übertragbar (z.B. Aktualisierungsfrequenz
und Ladegeschwindigkeit). Die Linktopologie, die Nutzungshäufigkeit, sowie die
Aktualisierungsfrequenz sind mit entsprechenden Modifikationen übertragbar.