TY - THES A1 - Bourgonje, Peter T1 - Shallow discourse parsing for German T1 - Shallow Discourse Parsing für Deutsch N2 - While the last few decades have seen impressive improvements in several areas in Natural Language Processing, asking a computer to make sense of the discourse of utterances in a text remains challenging. There are several different theories that aim to describe and analyse the coherent structure that a well-written text inhibits. These theories have varying degrees of applicability and feasibility for practical use. Presumably the most data-driven of these theories is the paradigm that comes with the Penn Discourse TreeBank, a corpus annotated for discourse relations containing over 1 million words. Any language other than English however, can be considered a low-resource language when it comes to discourse processing. This dissertation is about shallow discourse parsing (discourse parsing following the paradigm of the Penn Discourse TreeBank) for German. The limited availability of annotated data for German means the potential of modern, deep-learning based methods relying on such data is also limited. This dissertation explores to what extent machine-learning and more recent deep-learning based methods can be combined with traditional, linguistic feature engineering to improve performance for the discourse parsing task. A pivotal role is played by connective lexicons that exhaustively list the discourse connectives of a particular language along with some of their core properties. To facilitate training and evaluation of the methods proposed in this dissertation, an existing corpus (the Potsdam Commentary Corpus) has been extended and additional data has been annotated from scratch. The approach to end-to-end shallow discourse parsing for German adopts a pipeline architecture and either presents the first results or improves over state-of-the-art for German for the individual sub-tasks of the discourse parsing task, which are, in processing order, connective identification, argument extraction and sense classification. The end-to-end shallow discourse parser for German that has been developed for the purpose of this dissertation is open-source and available online. In the course of writing this dissertation, work has been carried out on several connective lexicons in different languages. Due to their central role and demonstrated usefulness for the methods proposed in this dissertation, strategies are discussed for creating or further developing such lexicons for a particular language, as well as suggestions on how to further increase their usefulness for shallow discourse parsing. N2 - Obwohl in den letzten Jahrzehnten beeindruckende Verbesserungen in verschiedenen Bereichen der natürlichen Sprachverarbeitung erzielt wurden, bleibt es für einen Computer eine Herausforderung, den Diskurs und Kontext von einem Text zu verstehen. Es gibt mehrere Theorien, die versuchen, die Struktur zu beschreiben und zu analysieren, die einem gut geschriebenen Text zugrunde liegt. Diese Theorien haben einen unterschiedlichen Grad an Anwendbarkeit und Machbarkeit für den praktischen Einsatz. Die vermutlich datengetriebenste dieser Theorien ist das Paradigma, das mit der Penn Discourse TreeBank einhergeht, einem für Diskursrelationen annotierten Korpus mit über 1 Million Wörtern. Jede andere Sprache als Englisch kann jedoch als ressourcenarme Sprache betrachtet werden, wenn es um die Diskursverarbeitung geht. In dieser Dissertation geht es uam "Shallow Discourse Parsing" (Diskursparsing nach dem Paradigma der Penn Discourse TreeBank) für Deutsch. Die begrenzte Verfügbarkeit von annotierten Daten für Deutsch bedeutet auch, dass das Potenzial moderner, Deep-Learning-basierter Methoden, die auf solchen Daten aufbauen, begrenzt ist. In dieser Dissertation wird untersucht, inwieweit maschinelles Lernen und Deep-Learning-basierte Methoden mit traditionellem, linguistischem Feature-Engineering kombiniert werden können, um die Leistung bei der Diskurs-Parsing-Aufgabe zu verbessern. Eine zentrale Rolle spielen dabei Lexika, die die Diskurskonnektive einer bestimmten Sprache mit einigen ihrer Kerneigenschaften vollständig auflisten. Um das Training und die Evaluierung der in dieser Dissertation vorgeschlagenen Methoden zu ermöglichen, wurde ein bestehender Korpus (der Potsdamer Kommentarkorpus) erweitert und zusätzliche Daten von Grund auf annotiert. Der Ansatz für "end-to-end" Diskurs-Parsing für Deutsch verwendet eine Pipeline-Architektur und präsentiert entweder die ersten Ergebnisse oder verbessert den Stand der Technik für Deutsch für die einzelnen Teilaufgaben der Diskurs-Parsing-Aufgabe, die in der Verarbeitungsreihenfolge Konnektoridentifikation, Argumentextraktion und Relationen-klassifikation sind. Der für diese Dissertation entwickelte Diskursparser für Deutsch ist Open-Source und online verfügbar. Im Zuge der Erstellung dieser Dissertation wurden mehrere Lexika mit Konnektoren für verschiedenen Sprachen bearbeitet. Aufgrund ihrer zentralen Rolle und nachgewiesenen Nützlichkeit für die in dieser Arbeit vorgeschlagenen Methoden werden Strategien zur Erstellung oder Weiterentwicklung solcher Lexika für eine bestimmte Sprache sowie Vorschläge zur weiteren Steigerung ihrer Nützlichkeit für das "Shallow Discourse Parsing" diskutiert. KW - discourse parsing KW - connectives KW - data annotation KW - NLP pipelines KW - text structure KW - Shallow Discourse Parsing KW - end-to-end discourse parsing KW - Diskurs-parsing KW - Konnektoren KW - Daten-annotation KW - Textstruktur KW - end-to-end diskurs-parsing Y1 - 2021 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-506632 ER - TY - THES A1 - Brehm-Jurish, Eva Ute T1 - Connective ties in discourse : three ERP-studies on causal, temporal and concessive connective ties and their influence on language processing T1 - Konnektiva im Diskurs : drei EKP-Studien zu kausalen, temporalen und konzessiven Konnektiva und ihrem Einfluß auf die Sprachverarbeitung N2 - Connective ties in discourse: Three ERP studies on causal, temporal and concessive connective ties and their influence on language processing. Questions In four experiments the influence of lexical connectives such as " darum", therefore, " danach", afterwards, and " trotzdem", nevertheless, on the processing of short two-sentence discourses was examined and compared to the processing of deictical sentential adverbs such as " gestern", yesterday, and " lieber", rather. These latter words do not have the property of signaling a certain discourse relation between two sentences, as connective ties do. Three questions were central to the work: * Do the processing contrasts found between connective and non-connective elements extend to connective ties and deictical sentential adverbs (experiments 2 and 3)? * Does the semantic content of the connective ties play the primary role, i.e is the major distinction to be made indeed between connective and non-connective or instead between causal, temporal and concessive? * When precisely is the information provided by connective ties used? There is some evidence that connective ties can have an immediate influence on the integration of subsequent elements, but the end of the second sentences appears to play an important role as well: experiments 2, 3, and 4. Conclusions First of all, the theoretical distinction between connective and non-connective elements does indeed have " cognitive reality" . This has already been shown in previous studies. The present studies do however show, that there is also a difference between one-place discourse elements (deictical sentential adverbs) and two-place discourse elements, namely connective ties, since all experiments examining this contrast found evidence for qualitatively and quantitatively different processing (experiments 1, 2, and 3). Secondly, the semantic type of the connective ties also plays a role. This was not shown for the LAN, found for all connective ties when compared to non-connective elements, and consequently interpreted as a more abstract reflection of the integration of connective ties. There was also no difference between causal and temporal connective ties before the end of the discourses in experiment 3. However, the N400 found for incoherent discourses in experiment 2, larger for connective incoherent than non-connective incoherent discourses, as well as the P3b found for concessive connective ties in the comparison between causal and concessive connective ties gave reason to assume that the semantic content of connective ties is made use of in incremental processing, and that the relation signaled by the connective tie is the one that readers attempt to construct. Concerning when the information provided by connective ties is used, it appears as if connectivity is generally and obligatorily taken at face value. As long as the meaning of a connective tie did not conflict with a preferred canonical discourse relation, there were no differences found for varying connective discourses (experiment 3). However, the fact that concessive connective ties announce the need for a more complex text representation was recognized and made use of immediately (experiment 4). Additionally, a violation of the discourse relation resulted in more difficult semantic integration if a connective tie was present (experiment 2). It is therefore concluded here that connective ties influence processing immediately. This claim has to be modified somewhat, since the sentence-final elements suggested that connective ties trigger different integration processes than non-connective elements. It seems as if the answer to the question of when connective ties are processed is neither exclusively immediately nor exclusively afterwards, but that both viewpoints are correct. It is suggested here that before the end of a discourse economy plays a central role in that a canonical relation is assumed unless there is evidence to the contrary. A connective tie could have the function of reducing the dimensions evaluated in a discourse to the one signaled by the connective tie. At the end of the discourse the representation is evaluated and verified, and an integrated situation model constructed. Here, the complexity of the different discourse relations that connective ties can signal, is expressed. N2 - Konnektiva im Diskurs: Drei EKP-Studien zu kausalen, temporalen und konzessiven Konnektoren und ihrem Einfluss auf die Sprachverarbeitung. Einführung und Fragestellung In vier Experimenten wurde der Einfluss von lexikalischen Konnektiva wie " darum", " danach" und " trotzdem" auf die Verarbeitung von kurzen zweisätzigen Diskursen untersucht und mit der Verarbeitung von deiktischen Satzaderbien wie " gestern" und " lieber" verglichen, die nicht wie die Konnektiva die Eigenschaft haben, die Diskursrelation zwischen zwei Sätzen explizit auszudrücken. Drei Fragen standen im Mittelpunkt der Arbeit: * Findet sich der Kontrast zwischen konnektiven und nicht-konnektiven Elementen auch zwischen Konnektiva und deiktischen Satzadverbien wieder (Experimente 2 und 3)? * Spielt der semantische Inhalt der Konnektiva die primäre Rolle: ist die Hauptunterscheidung zwischen konnektiven und nicht-konnektiven Elementen zu machen, oder zwischen kausalen (darum, deshalb), temporalen (danach, hinterher) und konzessiven (trotzdem, dennoch) Elementen (Experimente 3 / 4)? * Wann genau wird die Information, die Konnektiva bieten, genutzt? Es gibt Evidenz dafür, dass Konnektiva einen sofortigen Einfluss haben, aber auch dafür, dass das Ende der Texte eine gewichtige Rolle spielt: Experimente 2, 3, und 4. Konklusionen Zunächst einmal hat die theoretische Unterscheidung zwischen konnektiven und nicht-konnektiven Worten tatsächlich " kognitive Realität" . Dies wurde bereits in früheren Studien gezeigt. Die aktuellen Experimente zeigten jedoch, dass es auch einen Unterschied zwischen einstelligen (deiktische Satzadverbien) und zweistelligen (Konnektiva) Diskursrelationen gibt, da alle Experimente, die diesen Kontrast untersuchten, qualitativ und quantitativ andere Verarbeitung für Konnektiva zeigten (Experimente 1, 2 und 3). Zweitens spielt der semantische Typus der Konnektiva ebenfalls eine Rolle. Dieser Einfluss zeigte sich nicht für die LAN, die für alle Konnektiva im Vergleich mit nicht-konnektiven Elementen gefunden wurde, und die dementsprechend auch als Korrelat abstrakterer Integration von Konnektiva vorgeschlagen wird. Es zeigte sich ebenfalls kein Unterschied zwischen kausalen und temporalen Konnektiva vor dem Ende des Diskurses in Experiment 3. Die N400, gefunden für inkohärente Satzpaare in Experiment 2, größer für inkohärent konnektive als inkohärent nicht-konnektive Diskurse, wie auch die P3b, gefunden im Vergleich zwischen kausalen und konzessiven Konnektiva in Experiment 4, lieferten jedoch Grund zu der Annahme, dass die Bedeutung von Konnektiva in der inkrementellen Verarbeitung genutzt wird, und dass die Relation, die Konnektiva signalisieren, diejenige ist, die Leser versuchen zu erstellen. Im Hinblick auf wann die Information, die Konnektiva liefern, genutzt wird, scheint es, also ob Konnektivität generell und obligatorisch für bare Münze genommen wird. So lange die Bedeutung der Konnektiva nicht mit einer präferierten kanonischen Diskursrelation konfligierte, zeigten sich keine Differenzen innerhalb verschiedener konnektiver Diskurse (Experiment 3), aber die Tatsache, dass konzessive Konnektiva die Notwendigkeit einer komplexeren Textrepräsentation voraussagen, wurde sofort erkannt und genutzt (Experiment 4). Zusätzlich resultierte eine Verletzung der Diskursrelation in Experiment 2 in erschwerterer semantischer Integration, wenn ein Konnektivum vorhanden war. Es wird daher gefolgert, dass Konnektiva die Verarbeitung sofort beeinflussen. Diese Schlussfolgerung muss jedoch etwas abgeschwächt werden, da die satzfinalen Elemente darauf hinwiesen, dass Konnektiva andere Integrationsprozesse am Ende der Diskurse auslösten als nicht-konnektive Elemente. Es scheint, dass die Antwort auf die Frage, wann Konnektiva verarbeitet werden, weder sofort noch hinterher ist, sondern dass beide Sichtweisen korrekt sind. Es wird hier vorgeschlagen, dass vor dem Ende eines Diskurses Ökonomie insofern eine entscheidende Rolle spielt, als eine kanonische Relation angenommen wird so lange es keine gegenteilige Evidenz gibt. Ein Konnektivum könnte die evaluierten Dimensionen in einem Diskurs auf die signalisierten reduzieren. Am Ende des Diskurses wird die erstellte Textrepräsentation evaluiert und verifiziert, und ein integriertes Situationsmodell erstellt. Hier drückt sich dann die Komplexität der verschiedenen Diskursrelationen, die Konnktiva signalisieren können, aus. KW - Sprachverarbeitung KW - Ereigniskorreliertes Potenzial KW - Diskurssemantik KW - Konnektoren KW - Inferenzen KW - Diskursrepräsentation KW - Situationsmodell KW - language processing KW - evoked potentials KW - discourse processing KW - connective ties KW - inferences KW - situation model Y1 - 2005 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus-6780 ER -