Refine
Year of publication
- 2020 (1)
Document Type
- Bachelor Thesis (1)
Language
- German (1)
Has Fulltext
- no (1) (remove)
Keywords
- Python (1) (remove)
Die Technische Hochschule Köln bietet auf ihrer Webseite ein öffentliches Verzeichnis aller Beschäftigten an, welches Personendetailseiten mit Informationen zu Aufgabenbereichen, Lehrgebieten, Projekten, Publikationen, Lebensläufen etc. enthält. Die Hochschule erhält kontinuierlich Anfragen aus Wirtschaft und Öffentlichkeit, welche nach Experten in einem bestimmten Gebiet suchen, um Forschungsprojekte zu unterstützen oder Interviews zu aktuellen Situationen durchzuführen. Diese Anfragen können meist nur anhand von Erfahrungswerten an die passenden Ansprechpartner weitergegeben werden. Die Bachelorarbeit „Crawl Your Prof – Fact-Crawling von Hochschulseiten“ beschäftigt sich damit, öffentlich verfügbare Informationen über Professoren und andere Personen zu
sammeln, um ein Expertenprofil zu erstellen. Dabei werden gängige OSINT-Methodiken vorgestellt und mit Hilfe des Crawler-Frameworks Scrapy ein Prototyp erstellt, um die Personenrecherchen zu automatisieren. Des Weiteren wird ein Ausblick auf das Potential der gesammelten Daten mit beispielhaften Suchanfragen und Auswertungen durch das Python-Modul Pandas gegeben.