Volltext-Downloads (blau) und Frontdoor-Views (grau)

Automated statement extraction from press briefings

  • Wissenschaftliche Pressekonferenzen sind eine wertvolle Informationsquelle. Sie bestehen aus abwechselnden Reden von Expert:innen und Antworten auf Fragen aus dem Publikum und können daher zu einer faktenbasierten Berichterstattung beitragen. Obgleich Pressekonferenzen eine hohe Informationsdichte besitzen, ist das Extrahieren von relevanten Statements schwierig und zeitintensiv. Um diese Arbeit zu unterstützen, wird ein System vorgeschlagen, das automatisiert Statements aus Pressekonferenzen extrahiert. Claims, also Behauptungen über Sachverhalte, werden als zentrales Element eines Statements identifiziert und dienen als wichtigstes Feature, um Statements in Transkripten von Pressekonferenzen zu identifizieren. Hierzu wird ein zweistufiger Prozess vorgeschlagen. Zunächst werden mithilfe einer Single Label Multi-Class Sequenzklassifikation Sätze identifiziert, welche ein Claim enthalten. Anschließend werden die Sätze weiterverarbeitet, um irrelevante Sätze und solche mit anaphorischen Verbindungen herauszufiltern oder die Länge der Statements zu beeinflussen. Die Ergebnisse lassen vermuten, dass das Identifizieren von Claims erfolgreich eingesetzt werden kann, um Statements in Pressekonferenzen zu finden. Obwohl viele Statements mit diesem automatisierten System extrahiert werden können, sind die extrahierten Sätze nicht immer schlüssig genug, um ohne weiteren Kontext verstanden zu werden und benötigen weitere Begutachtung durch fachkundige Personen.
  • Scientific press briefings are a valuable information source. They consist of alternating expert speeches and answers to questions from the audience. Therefore, they can contribute to fact based media coverage. Even though press briefings are highly informative, filtering this information and extracting relevant statements is challenging and time-consuming. To support this task, an automated statement extraction system is proposed. Claims are identified as a core component of a statement and used as the main feature to identify statements in press briefing transcripts. The statement extraction task is formulated as a two-step procedure. First, claim sentences are identified with a single label multi-class sequence classification. Second, the sentences are filtered to improve the coherence and assess the length of the statements. The results provided indicate that claim detection can be used to identify statements in press briefings. While many statements can be extracted automatically with this system, these are not always as coherent as needed to be understood without context and may need further assessment through knowledgeable persons.

Download full text files

Export metadata

Additional Services

Share in Twitter Search Google Scholar

Statistics

frontdoor_oas
Metadaten
Author:Jüri Keller
Document Type:Bachelor Thesis
Year of first Publication:2022
Date of final exam:2022/02/15
First Referee:Philipp SchaerGND
Advisor:Meik Bittkowski
Degree Program:Data and Information Science
Language:German
Page Number:47
Tag:Claim Detection; Computational Journalim
GND Keyword:Data Mining
URN:urn:nbn:de:hbz:79pbc-opus-18572
Licence (German):License LogoCreative Commons - Namensnennung-Weitergabe unter gleichen Bedingungen