@phdthesis{Ehnert2018, type = {Bachelor Thesis}, author = {Philip Ehnert}, title = {Web Scraping als Monitoring-Instrument f{\"u}r Massenmedien im Web}, url = {https://nbn-resolving.org/urn:nbn:de:hbz:79pbc-opus-12475}, pages = {46}, year = {2018}, abstract = {W{\"a}hrend traditionelle Medieninhaltsanalysen eine etablierte Methode in der empirischen Sozialforschung darstellen, so werden sie doch selten mit analytischen Verfahren zur Verarbeitung gro{\"s}er Dokumentenkollektionen kombiniert (Blei u.a., 2003), die Aufschluss {\"u}ber latente inhaltliche Schwerpunkte einzelner Nachrichtenportale sowie deren relative Themenverteilung liefern k{\"o}nnen. Im Vordergrund der Forschungsarbeiten stand daher die technische Realisierung eines automatisierten Verfahrens, das als Instrument zur Beobachtung der massenmedialen Agenda im Web dient. Zu diesem Zweck musste eine eigene Infrastruktur entwickelt werden, welche die Medienbeobachtung verschiedener Kan{\"a}le (u.a. “BILD”, “Spiegel”, “Junge Freiheit”) m{\"o}glich machte. Im Fokus steht hierbei die Entwicklung von drei Kernelementen des Monitoring-Instruments, die f{\"u}r die Archivierung, die Aufbereitung und schlie{\"s}lich die inhaltliche Analyse der Artikel aus den RSS-Kan{\"a}len der einzelnen Nachrichtenportale zust{\"a}ndig sind. Neben dem o.g. Verfahren zur Aufdeckung latenter Themenkomplexe mithilfe des sogenannten LDA Topic Modellings bieten die in strukturierter Form vorliegenden Artikel aus dem Dokumentenkorpus ein breites Spektrum an weiteren Anwendungsm{\"o}glichkeiten. So wird das mittels Frequenzanalysen ermittelte Aufkommen von Themen in der massenmedialen Agenda ferner mit Umfragedaten kombiniert, die zuk{\"u}nftig Aufschluss {\"u}ber die {\"o}ffentliche Meinungsbildung zu den in den Medien vorkommenden Themen liefern k{\"o}nnen. Insbesondere die Forschungsergebnisse der LDA-Analyse zeigen, dass die relative Themenverteilung der entsprechenden Nachrichtenportale auf einen Blick dargestellt werden kann; somit leisten die erzielten Ergebnisse einen Beitrag, ein tieferes Verst{\"a}ndnis von komplexen sozialwissenschaftlichen Zusammenh{\"a}ngen, wie in diesem Fall der Agenda eines massenmedialen Akteurs, zu erlangen und diese mithilfe entsprechender Visualisierungen greifbar zu machen.}, language = {de} }