@book{OPUS4-4027, title = {Das Fremde und der Text : fremdsprachige Kommunikation und ihre Ergebnisse}, editor = {Krause, Wolf-Dieter}, publisher = {Universit{\"a}tsverlag Potsdam}, address = {Potsdam}, isbn = {978-3-86956-033-5}, url = {http://nbn-resolving.de/urn:nbn:de:kobv:517-opus-40447}, publisher = {Universit{\"a}t Potsdam}, pages = {303}, year = {2010}, abstract = {Dass die Textlinguistik nicht umhin kommt, ihre Beschreibungen und ihr Instrumentarium auch im Hinblick auf Texte zu {\"u}berpr{\"u}fen, die nicht von Muttersprachlern erzeugt worden sind, ist durch die wachsenden Bed{\"u}rfnisse nach fremdsprachiger Kommunikation und die rapide steigende Zahl entsprechender kommunikativer Ereignisse bedingt. Der Fokus der vorliegenden Publikation liegt auf dem fremdsprachigen Text (vorzugsweise in seiner schriftlichen, monologischen Auspr{\"a}gung) als sprachlicher Gr{\"o}ße liegen. Bei der Analyse fremdsprachiger Texte werden neben textlinguistischen Fragen aber auch andere Gesichtspunkte ber{\"u}cksichtigt: soziolinguistische Aspekte, z.B. in Bezug auf die Kommunikationspartner, die kommunikativen Dom{\"a}nen, den sozial-historischen Rahmen der Kommunikation usw., psycholinguistische Hintergr{\"u}nde, z.B. im Hinblick auf die kognitive Verarbeitung fremdsprachlich-kommunikativer Anforderungen, literaturwissenschaftliche Bez{\"u}ge, etwa hinsichtlich fremdsprachiger Einfl{\"u}sse auf literarische Werke und ihre Rolle im literarischen Diskurs, translationswissenschaftliche Gesichtspunkte im Hinblick auf die Adaptation und Bewahrung des Fremden im {\"u}bersetzten Text sowie p{\"a}dagogisch-didaktische Fragen im Rahmen des gesteuerten Fremdsprachenerwerbs.}, language = {de} } @book{StedeMamprinPeldszusetal.2015, author = {Stede, Manfred and Mamprin, Sara and Peldszus, Andreas and Herzog, Andr{\´e} and Kaupat, David and Chiarcos, Christian and Warzecha, Saskia}, title = {Handbuch Textannotation}, editor = {Stede, Manfred}, isbn = {978-3-86956-343-5}, url = {http://nbn-resolving.de/urn:nbn:de:kobv:517-opus4-82761}, publisher = {Universit{\"a}t Potsdam}, pages = {xvii, 209}, year = {2015}, abstract = {Das Potsdamer Kommentarkorpus ist eine Sammlung von Zeitungstexten, die dem Genre 'Kommentar' zuzuordnen sind. Der {\"o}ffentlich verf{\"u}gbare Teil besteht aus 175 Texten aus der M{\"a}rkischen Allgemeinen Zeitung, die hinsichtlich Syntax, Koreferenz, Konnektoren und Rhetorische Struktur manuell annotiert wurden. Weitere Ebenen werden bei zuk{\"u}nftigen Korpusversionen hinzukommen. Dieses Buch enth{\"a}lt die Annotationsrichtlinien, die der Bearbeitung des {\"o}ffentlichen Teils des Korpus zugrunde lagen, sowie auch anderer Teile, bei denen mit weiteren Annotationsebenen experimentiert wurde. Die meisten der Richtlinien werden auch f{\"u}r {\"a}hnliche Text-Genres und f{\"u}r andere Sprachen verwendbar sein.}, language = {de} } @phdthesis{Bourgonje2021, author = {Bourgonje, Peter}, title = {Shallow discourse parsing for German}, doi = {10.25932/publishup-50663}, url = {http://nbn-resolving.de/urn:nbn:de:kobv:517-opus4-506632}, school = {Universit{\"a}t Potsdam}, pages = {vii, 140}, year = {2021}, abstract = {While the last few decades have seen impressive improvements in several areas in Natural Language Processing, asking a computer to make sense of the discourse of utterances in a text remains challenging. There are several different theories that aim to describe and analyse the coherent structure that a well-written text inhibits. These theories have varying degrees of applicability and feasibility for practical use. Presumably the most data-driven of these theories is the paradigm that comes with the Penn Discourse TreeBank, a corpus annotated for discourse relations containing over 1 million words. Any language other than English however, can be considered a low-resource language when it comes to discourse processing. This dissertation is about shallow discourse parsing (discourse parsing following the paradigm of the Penn Discourse TreeBank) for German. The limited availability of annotated data for German means the potential of modern, deep-learning based methods relying on such data is also limited. This dissertation explores to what extent machine-learning and more recent deep-learning based methods can be combined with traditional, linguistic feature engineering to improve performance for the discourse parsing task. A pivotal role is played by connective lexicons that exhaustively list the discourse connectives of a particular language along with some of their core properties. To facilitate training and evaluation of the methods proposed in this dissertation, an existing corpus (the Potsdam Commentary Corpus) has been extended and additional data has been annotated from scratch. The approach to end-to-end shallow discourse parsing for German adopts a pipeline architecture and either presents the first results or improves over state-of-the-art for German for the individual sub-tasks of the discourse parsing task, which are, in processing order, connective identification, argument extraction and sense classification. The end-to-end shallow discourse parser for German that has been developed for the purpose of this dissertation is open-source and available online. In the course of writing this dissertation, work has been carried out on several connective lexicons in different languages. Due to their central role and demonstrated usefulness for the methods proposed in this dissertation, strategies are discussed for creating or further developing such lexicons for a particular language, as well as suggestions on how to further increase their usefulness for shallow discourse parsing.}, language = {en} }