TY - THES U1 - Bachelor Thesis A1 - Keller, Jüri T1 - Automated statement extraction from press briefings N2 - Scientific press briefings are a valuable information source. They consist of alternating expert speeches and answers to questions from the audience. Therefore, they can contribute to fact based media coverage. Even though press briefings are highly informative, filtering this information and extracting relevant statements is challenging and time-consuming. To support this task, an automated statement extraction system is proposed. Claims are identified as a core component of a statement and used as the main feature to identify statements in press briefing transcripts. The statement extraction task is formulated as a two-step procedure. First, claim sentences are identified with a single label multi-class sequence classification. Second, the sentences are filtered to improve the coherence and assess the length of the statements. The results provided indicate that claim detection can be used to identify statements in press briefings. While many statements can be extracted automatically with this system, these are not always as coherent as needed to be understood without context and may need further assessment through knowledgeable persons. N2 - Wissenschaftliche Pressekonferenzen sind eine wertvolle Informationsquelle. Sie bestehen aus abwechselnden Reden von Expert:innen und Antworten auf Fragen aus dem Publikum und können daher zu einer faktenbasierten Berichterstattung beitragen. Obgleich Pressekonferenzen eine hohe Informationsdichte besitzen, ist das Extrahieren von relevanten Statements schwierig und zeitintensiv. Um diese Arbeit zu unterstützen, wird ein System vorgeschlagen, das automatisiert Statements aus Pressekonferenzen extrahiert. Claims, also Behauptungen über Sachverhalte, werden als zentrales Element eines Statements identifiziert und dienen als wichtigstes Feature, um Statements in Transkripten von Pressekonferenzen zu identifizieren. Hierzu wird ein zweistufiger Prozess vorgeschlagen. Zunächst werden mithilfe einer Single Label Multi-Class Sequenzklassifikation Sätze identifiziert, welche ein Claim enthalten. Anschließend werden die Sätze weiterverarbeitet, um irrelevante Sätze und solche mit anaphorischen Verbindungen herauszufiltern oder die Länge der Statements zu beeinflussen. Die Ergebnisse lassen vermuten, dass das Identifizieren von Claims erfolgreich eingesetzt werden kann, um Statements in Pressekonferenzen zu finden. Obwohl viele Statements mit diesem automatisierten System extrahiert werden können, sind die extrahierten Sätze nicht immer schlüssig genug, um ohne weiteren Kontext verstanden zu werden und benötigen weitere Begutachtung durch fachkundige Personen. KW - Data Mining KW - Computational Journalim KW - Claim Detection Y2 - 2022 U6 - https://nbn-resolving.org/urn:nbn:de:hbz:79pbc-opus-18572 UN - https://nbn-resolving.org/urn:nbn:de:hbz:79pbc-opus-18572 SP - 47 S1 - 47 ER -