TY  - THES
A1  - Atasoy, Atilla
T1  - Production, perception, and processing of focus in Turkish
N2  - The main goal of this dissertation is to experimentally investigate how focus is realised, perceived, and processed by native Turkish speakers, independent of preconceived notions of positional restrictions. Crucially, there are various issues and scientific debates surrounding focus in the Turkish language in the existing literature (chapter 1). It is argued in this dissertation that two factors led to the stagnant literature on focus in Turkish: the lack of clearly defined, modern understandings of information structure and its fundamental notion of focus, and the ongoing and ill-defined debate surrounding the question of whether there is an immediately preverbal focus position in Turkish. These issues gave rise to specific research questions addressed across this dissertation. Specifically, we were interested in how the focus dimensions such as focus size (comparing narrow constituent and broad sentence focus), focus target (comparing narrow subject and narrow object focus), and focus type (comparing new-information and contrastive focus) affect Turkish focus realisation and, in turn, focus comprehension when speakers are provided syntactic freedom to position focus as they see fit. 

To provide data on these core goals, we presented three behavioural experiments based on a systematic framework of information structure and its notions (chapter 2): (i) a production task with trigger wh-questions and contextual animations manipulated to elicit the focus dimensions of interest (chapter 3), (ii) a timed acceptability judgment task in listening to the recorded answers in our production task (chapter 4), and (iii) a self-paced reading task to gather on-line processing data (chapter 5).

Based on the results of the conducted experiments, multiple conclusions are made in this dissertation (chapter 6). Firstly, this dissertation demonstrated empirically that there is no focus position in Turkish, neither in the sense of a strict focus position language nor as a focally loaded position facilitating focus perception and/or processing. While focus is, in fact, syntactically variable in the Turkish preverbal area, this is a consequence of movement triggered by other IS aspects like topicalisation and backgrounding, and the observational markedness of narrow subject focus compared to narrow object focus. As for focus type in Turkish, this dimension is not associated with word order in production, perception, or processing. Significant acoustic correlates of focus size (broad sentence focus vs narrow constituent focus) and focus target (narrow subject focus vs narrow object focus) were observed in fundamental frequency and intensity, representing focal boost, (postfocal) deaccentuation, and the presence or absence of a phrase-final rise in the prenucleus, while the perceivability of these effects remains to be investigated. In contrast, no acoustic correlates of focus type in simple, three-word transitive structures were observed, with focus types being interchangeable in mismatched question-answer pairs. Overall, the findings of this dissertation highlight the need for experimental investigations regarding focus in Turkish, as theoretical predictions do not necessarily align with experimental data. As such, the fallacy of implying causation from correlation should be strictly kept in mind, especially when constructions coincide with canonical structures, such as the immediately preverbal position in narrow object foci. Finally, numerous open questions remain to be explored, especially as focus and word order in Turkish are multifaceted. As shown, givenness is a confounding factor when investigating focus types, while thematic role assignment potentially confounds word order preferences. Further research based on established, modern information structure frameworks is needed, with chapter 5 concluding with specific recommendations for such future research.
N2  - Das Hauptziel dieser Dissertation war die experimentelle Untersuchung, wie Muttersprachler des Türkischen Fokus realisieren, wahrnehmen und sprachlich verarbeiten, unabhängig von vorgefassten Meinungen betreffend Positionsbeschränkungen. Entscheidend ist, dass es in der vorhandenen Literatur verschiedene Probleme und wissenschaftliche Debatten zum Thema Fokus in der türkischen Sprache gibt (Kapitel 1). In dieser Dissertation wird argumentiert, dass zwei Faktoren zu der stagnierenden Forschung zum Thema Fokus im Türkischen beitrugen: Das Fehlen eines klar definierten modernen Verständnisses der Informationsstruktur und ihres grundlegenden Begriffs von Fokus und die anhaltende und unklare Debatte um die Frage, ob es im Türkischen eine unmittelbar präverbale Fokusposition gibt. Diese Probleme führten zu den jeweiligen Forschungsfragen, die in dieser Dissertation behandelt wurden. Ausdrücklich lag das Interesse darauf, wie die Fokusdimensionen Fokusgröße, der Vergleich von schmalem Fokus (narrow focus) auf der Konstituente und breitem, projiziertem Fokus (broad focus) auf dem Satz, Fokusziel, der Vergleich von schmalem Subjektfokus und Objektfokus, und Fokustyp, der Vergleich von Fokus auf neuer Information (new-inforamtion focus) und Kontrastfokus, die Fokusrealisierung und -wahrnehmung im Türkischen beeinflussen, wenn den Sprechern syntaktische Freiheit gegeben wird Fokus nach Belieben im Satz zu positionieren.
 
Basierend auf einen systematischen theoretischen Rahmen der Informationsstruktur und ihrer Begriffe (Kapitel 2), wurden drei Verhaltensexperimente in dieser Dissertation präsentiert, um Daten zu diesen Kernzielen vorzulegen: (i) ein Produktionsexperiment mit Fragen und kontextbezogenen Animationen als Trigger manipuliert, um die obengenannten Fokusdimensionen zu untersuchen, (ii) ein zeitlich gemessenes Akzeptanzexperiment (timed acceptability judgment task) beim Anhören der Antworten aufgezeichnet in unserem Produktionsexperiment und (iii) ein selbstbestimmtes Leseexperiment (self-paced reading task) zur Untersuchung der sprachlichen Verarbeitung (on-line language processing).

Auf der Grundlage der Ergebnisse der durchgeführten Experimente werden in dieser Dissertation mehrere Schlussfolgerungen gezogen (Kapitel 6). Diese Dissertation hat zum einen empirisch nachgewiesen, dass es im Türkischen keine Fokusposition gibt, weder im Sinne einer strikten Fokusposition noch als fokal geladene Position, die die Fokuswahrnehmung und/oder -verarbeitung erleichtert. Während Fokus im türkischen präverbalen Bereich tatsächlich syntaktisch variabel ist, ist dies eine Folge syntaktischer Strategien anderer IS-Aspekte, wie etwa Topikalisierung und Hintergrundbildung (backgrounding), wie auch die additive Kennzeichnung schmaler Subjektfokusse im Vergleich zum Objektfokus. Was Fokustyp im Türkischen betrifft, ist diese Fokusdimension nicht mit Wortstellung in Produktion, Wahrnehmung oder Verarbeitung assoziiert. Signifikante akustische Korrelate der Fokusgröße (breiter Satzfokus vs. schmalen Konstituentenfokus) und Fokusziel (schmaler Subjektfokus vs. schmalen Objektfokus) in Grundfrequenz und Intensität in Form von Fokusverstärkung (focal boost), (postfokaler) Deakzentuierung und dem Vorhandensein oder Fehlen eines phrasenfinalen Anstiegs im Pränukleus wurden beobachtet, während die Wahrnehmbarkeit dieser Effekte noch zu untersuchen ist. Im Gegensatz dazu wurden keine akustischen Korrelate für Fokustyp in simplen transitiven Dreiwortstrukturen beobachtet, wobei Fokustypen in nicht übereinstimmenden Frage-Antwort-Paaren austauschbar waren. Insgesamt unterstreichen die oben skizzierten Ergebnisse dieser Dissertation die Notwendigkeit experimenteller Untersuchungen zu Fokus im Türkischen, da theoretische Vorhersagen nicht immer mit experimentellen Daten übereinstimmen. Der Trugschluss, dass Korrelation Kausalität impliziert, sollte strikt im Auge behalten werden, insbesondere wenn Konstruktionen mit kanonischen Strukturen übereinstimmen, wie etwa die unmittelbar präverbale Position in schmalen Objektfokussen. Schließlich sind noch zahlreiche offene Fragen zu klären, zumal Fokus und Wortstellung im Türkischen vielfältig sind. Wie in dieser Dissertation gezeigt wurde, ist Gegebenheit ein Störfaktor in der Untersuchung von Fokustypen. Ebenfalls ist zu vermuten, dass thematische Rollenzuweisung im Türkischen Präferenzen in Wortstellung hervorrufen können, die als Fokuseffekte fehlinterpretiert werden könnten. Weitere Forschung auf der Grundlage etablierter theoretischer Informationsstrukturrahmen ist erforderlich. Kapitel 5 schließt mit konkreten Empfehlungen für solche zukünftigen Untersuchungen ab.
T2  - Produktion, Wahrnehmung und Verarbeitung von Fokus im Türkischen
KW  - focus
KW  - information structure
KW  - Turkish
KW  - focus realisation
KW  - Türkisch
KW  - Fokus
KW  - Fokusrealisierung
KW  - Informationsstruktur
Y1  - 2022
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-548156
ER  - 
TY  - THES
A1  - Galetzka, Fabian
T1  - Investigating and improving background context consistency in neural conversation models
N2  - Neural conversation models aim to predict appropriate contributions to a (given) conversation by using neural networks trained on dialogue data. A specific strand focuses on non-goal driven dialogues, first proposed by Ritter et al. (2011): They investigated the task of transforming an utterance into an appropriate reply. Then, this strand evolved into dialogue system approaches using long dialogue histories and additional background context. Contributing meaningful and appropriate to a conversation is a complex task, and therefore research in this area has been very diverse: Serban et al. (2016), for example, looked into utilizing variable length dialogue histories, Zhang et al. (2018) added additional context to the dialogue history, Wolf et al. (2019) proposed a model based on pre-trained Self-Attention neural networks (Vasvani et al., 2017), and Dinan et al. (2021) investigated safety issues of these approaches. This trend can be seen as a transformation from trying to somehow carry on a conversation to generating appropriate replies in a controlled and reliable way. 

In this thesis, we first elaborate the meaning of appropriateness in the context of neural conversation models by drawing inspiration from the Cooperative Principle (Grice, 1975). We first define what an appropriate contribution has to be by operationalizing these maxims as demands on conversation models: being fluent, informative, consistent towards given context, coherent and following a social norm. Then, we identify different targets (or intervention points) to achieve the conversational appropriateness by investigating recent research in that field.

In this thesis, we investigate the aspect of consistency towards context in greater detail, being one aspect of our interpretation of appropriateness. 

During the research, we developed a new context-based dialogue dataset (KOMODIS) that combines factual and opinionated context to dialogues. The KOMODIS
dataset is publicly available and we use the data in this thesis to gather new insights in context-augmented dialogue generation.

We further introduced a new way of encoding context within Self-Attention based neural networks. For that, we elaborate the issue of space complexity from knowledge graphs,
and propose a concise encoding strategy for structured context inspired from graph neural networks (Gilmer et al., 2017) to reduce the space complexity of the additional context. We discuss limitations of context-augmentation for neural conversation models, explore the characteristics of knowledge graphs, and explain how we create and augment knowledge graphs for our experiments. 

Lastly, we analyzed the potential of reinforcement and transfer learning to improve context-consistency for neural conversation models. We find that current reward functions need to be more precise to enable the potential of reinforcement learning, and that sequential transfer learning can improve the subjective quality of generated dialogues.
N2  - Neuronale Konversationsmodelle versuchen einen angemessenen Beitrag zu einer (gegebenen) Konversation zu erzeugen, indem neuronale Netze auf Dialogdaten trainiert werden. Ein spezieller Forschungszweig beschäftigt sich mit den nicht-zielgeführten Dialogen, erstmals vorgestellt von Ritter et al. (2011): Das Team untersuchte die Aufgabe der Transformation einer Äußerung in eine angemessene Antwort. Im Laufe der Zeit hat dieser Zweig Dialogsystem-Ansätze hervorgebracht, die lange Konversationen und zusätzlichen Kontext verarbeiten können. Einen sinnvollen und angemessenen Beitrag zu einem Gespräch zu leisten, ist eine komplexe Aufgabe, und daher war die Forschung auf diesem Gebiet sehr vielfältig: Serban et al. (2016) untersuchten beispielsweise die Verwendung von Dialogverläufen variabler Länge, Zhang et al. (2018) fügten der Dialoggeschichte zusätzlichen Kontext hinzu, Wolf et al. (2019) schlugen ein Modell vor, das auf vortrainierten neuronalen Self-Attention Schichten basiert (Vasvani et al., 2017), und Dinan et al. (2021) untersuchten Ansätze zur Kontrolle von unangebrachten Inhalten, wie zum Beispiel Beleidigungen. Dieser Trend kann als Transformation gesehen werden, der vom Versuch, ein Gespräch irgendwie fortzuführen, hin zum kontrollierten und zuverlässigen Generieren angemessener Antworten reicht.

In dieser Arbeit untersuchen wir den Aspekt der Kontextkonsistenz genauer, der ein Aspekt unserer Interpretation von einem angemessenen Konversationsbeitrag ist.

Während der Untersuchungen haben wir einen neuen kontextbasierten Dialogdatensatz (KOMODIS) entwickelt, der sachlichen und meinungsbezogenen Kontext zu Dialogen kombiniert. Der KOMODIS Datensatz ist öffentlich verfügbar, und wir verwenden die Daten in dieser Arbeit, um neue Einblicke in die kontextunterstützte Dialoggenerierung zu gewinnen.

Wir haben außerdem eine neue Methode zur Eingabe von Kontext auf Self-Attention basierenden neuronalen Netzen entwickelt. Dazu erörtern wir zunächst das Problem der begrenzten Eingabelänge für Sequenzen aus Wissensgraphen in solche Modelle,
und schlagen eine effiziente Codierungsstrategie für strukturierten Kontext vor, die von Graph Neural Networks inspiriert ist (Gilmer et al., 2017), um die Komplexität des zusätzlichen Kontexts zu reduzieren. Wir diskutieren die Grenzen der Kontexterweiterung für neuronale Konversationsmodelle, untersuchen die Eigenschaften von Wissensgraphen und erklären, wie wir Wissensgraphen für unsere Experimente erstellen und erweitern können.

Schließlich haben wir das Potenzial von Reinforcement Learning und Transfer Learning analysiert, um die Kontextkonsistenz für neuronale Konversationsmodelle zu verbessern. Wir stellen fest, dass aktuelle Reward Funktionen präziser sein müssen, um das Potenzial von Reinforcement Learning zu nutzen, und dass Sequential Transfer Learning die subjektive Qualität der generierten Dialoge verbessern kann.
KW  - conversational ai
KW  - neural conversation models
KW  - context consistency
KW  - gpt
KW  - conversation
KW  - dialogue
KW  - deep learning
KW  - knowledge graphs
KW  - Kontextkonsistenz
KW  - Konversation
KW  - Dialog KI
KW  - Deep Learning
KW  - Dialog
KW  - GPT
KW  - Wissensgraph
KW  - neuronale Konversationsmodelle
Y1  - 2022
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-584637
ER  - 
TY  - THES
A1  - Mertzen, Daniela
T1  - A cross-linguistic investigation of similarity-based interference in sentence comprehension
T1  - Eine cross-linguistische Untersuchung ähnlichkeitsbasierter Interferenz in der Satzverarbeitung
N2  - The aim of this dissertation was to conduct a larger-scale cross-linguistic empirical investigation of similarity-based interference effects in sentence comprehension. 
Interference studies can offer valuable insights into the mechanisms that are involved in long-distance dependency completion. 
Many studies have investigated similarity-based interference effects, showing that syntactic and semantic information are employed during long-distance dependency formation (e.g., Arnett & Wagers, 2017; Cunnings & Sturt, 2018; Van Dyke, 2007, Van Dyke & Lewis, 2003; Van Dyke & McElree, 2011). Nevertheless, there are some important open questions in the interference literature that are critical to our understanding of the constraints involved in dependency resolution. 

The first research question concerns the relative timing of syntactic and semantic interference in online sentence comprehension. Only few interference studies have investigated this question, and, to date, there is not enough data to draw conclusions with regard to their time course (Van Dyke, 2007; Van Dyke & McElree, 2011). 
Our first cross-linguistic study explores the relative timing of syntactic and semantic interference in two eye-tracking reading experiments that implement the study design used in Van Dyke (2007). The first experiment tests English sentences. The second, larger-sample experiment investigates the two interference types in German. 
Overall, the data suggest that syntactic and semantic interference can arise simultaneously during retrieval.

The second research question concerns a special case of semantic interference: We investigate whether cue-based retrieval interference can be caused by semantically similar items which are not embedded in a syntactic structure.
This second interference study builds on a landmark study by Van Dyke & McElree (2006). The study design used in their study is unique in that it is able to pin down the source of interference as a consequence of cue overload during retrieval, when semantic retrieval cues do not uniquely match the retrieval target. Unlike most other interference studies, this design is able to rule out encoding interference as an alternative explanation. Encoding accounts postulate that it is not cue overload at the retrieval site but the erroneous encoding of similar linguistic items in memory that leads to interference (Lewandowsky et al., 2008; Oberauer & Kliegl, 2006). While Van Dyke & McElree (2006) reported cue-based retrieval interference from sentence-external distractors, the evidence for this effect was weak. A subsequent study did not show interference of this type (Van Dyke et al., 2014). Given these inconclusive findings, further research is necessary to investigate semantic cue-based retrieval interference.
The second study in this dissertation provides a larger-scale cross-linguistic investigation of cue-based retrieval interference from sentence-external items. Three larger-sample eye-tracking studies in English, German, and Russian tested cue-based interference in the online processing of filler-gap dependencies.  This study further extends the previous research by investigating interference in each language under varying task demands (Logačev & Vasishth, 2016; Swets et al., 2008). 
Overall, we see some very modest support for proactive cue-based retrieval interference in English. Unexpectedly, this was observed only under a low task demand. In German and Russian, there is some evidence against the interference effect. It is possible that interference is attenuated in languages with richer case marking.  

In sum, the cross-linguistic experiments on the time course of syntactic and semantic interference from sentence-internal distractors support existing evidence of syntactic and semantic interference during sentence comprehension. Our data further show that both types of interference effects can arise simultaneously. Our cross-linguistic experiments investigating semantic cue-based retrieval interference from sentence-external distractors suggest that this type of interference may arise only in specific linguistic contexts.
N2  - Ziel dieser Dissertation war es, eine größer-angelegte, sprachübergreifende, empirische Untersuchung von Interferenzeffekten beim Satzverstehen durchzuführen. 
Interferenzstudien bieten wertvolle Einblicke in die Mechanismen, die während der Satzverarbeitung, insbesondere bei der Bildung von nicht-lokalen Dependenzen eine Rolle spielen. 
Studien zu ähnlichkeitsbasierten Interferenzeffekten haben gezeigt, dass syntaktische und semantische Informationen bei der Bildung von nicht-lokalen Dependenzen verwendet werden (z. B. Arnett & Wagers, 2017; Cunnings & Sturt, 2018; Van Dyke, 2007, Van Dyke & Lewis, 2003; Van Dyke & McElree, 2011). Dennoch bleiben in der Interferenzliteratur einige wichtige Fragen unbeantwortet, die für unser Verständnis der Satzverarbeitungsmechanismen von Bedeutung sind. 

Die erste Forschungsfrage betrifft den zeitlichen Ablauf syntaktischer und semantischer Interferenz während des Satzverstehens. Nur wenige Interferenzstudien haben diese Frage untersucht, jedoch sind aktuell nicht genügend Daten vorhanden, um Schlussfolgerungen bezüglich des zeitlichen Verlaufs zu ziehen (Van Dyke, 2007; Van Dyke & McElree, 2011). 
Die erste sprachübergreifende Studie in dieser Dissertation untersucht den zeitlichen Ablauf von syntaktischer und semantischer Interferenz mithilfe zweier Eyetracking-Leseexperimente. Diese nutzen das von Van Dyke (2007) implementierte Studiendesign. Das erste Experiment testet englische Sätze. Das zweite Experiment, welches eine größere Stichprobe untersucht, testet Interferenzeffekte im Deutschen. 
Insgesamt deuten die Daten darauf hin, dass syntaktische und semantische Interferenzeffekte zeitgleich auftreten können.

Die zweite Forschungsfrage untersucht einen Spezialfall der semantischen Interferenz: Es wird untersucht, ob cue-abhängige Abrufinterferenz durch Items verursacht werden kann, die nicht in die syntaktische Struktur eingebettet sind.
Diese zweite Interferenzstudie nutzt das Studiendesign von Van Dyke & McElree (2006), welches in der Lage ist, die Quelle der Interferenzeffekte als Folge von “cue overload” zu bestimmen, d.h., wenn semantische cues während des Abrufs aus dem Gedächtnis nicht eindeutig mit dem Zielwort übereinstimmen. Im Gegensatz zu anderen Interferenzstudien kann dieses Design Enkodierungsinterferenz als alternative Erklärung ausschließen. Enkodierungsansätze nehmen an, dass nicht ein “cue overload”, sondern eine fehlerhafte Kodierung ähnlicher Items im Gedächtnis Interferenz zur Folge hat (Lewandowsky et al., 2008; Oberauer & Kliegl, 2006). 
Obwohl die Van Dyke & McElree (2006) Studie angibt, cue-basierte Interferenz zu beobachten, ist die Evidenz für diesen Effekt schwach. Eine Folgestudie findet keine Evidenz für Interferenzeffekte dieser Art (Van Dyke et al., 2014). Die nicht eindeutigen Ergebnisse erfordern weitere Untersuchungen semantischer cue-basierter Interferenz.

Die zweite Studie in dieser Dissertation untersucht cue-basierte Interferenzeffekte durch Items, die nicht in die syntaktische Struktur eingebettet sind. Drei Eyetracking-Studien, im Englischen, Deutschen und Russischen, untersuchen cue-basierte Interferenz während der Verarbeitung von “filler-gap” Dependenzen.  Diese Studie ergänzt bisherige Studien, indem sie Interferenz in mehreren Sprachen sowie unter unterschiedlich komplexen Aufgabenanforderungen untersucht (Logačev & Vasishth, 2016; Swets et al., 2008). 
Insgesamt zeigen die Daten nur sehr schwache Evidenz für cue-basierte Interferenz im Englischen, und ausschließlich unter wenig komplexen Aufgabenanforderungen. 
Im Deutschen und Russischen sprechen die Daten gegen einen Interferenzeffekt, was darauf hinweisen könnte, dass Interferenzeffekte in Sprachen mit reicher Kasusmarkierung nur abgeschwächt vorzufinden sind.  

Insgesamt zeigen die sprachübergreifenden Experimente zum zeitlichen Verlauf syntaktischer und semantischer Interferenz durch satz-interne Items, dass beide Arten von Interferenzeffekten gleichzeitig auftreten können. Unsere sprachübergreifenden Experimente zur Untersuchung semantischer Interferenzen durch satz-externe Items deuten darauf hin, dass diese Art von Interferenz nur kontextspezifisch auftritt.
KW  - psycholinguistics
KW  - sentence processing
KW  - cue-based retrieval
KW  - similarity-based interference
KW  - eye-tracking
KW  - Psycholinguistik
KW  - Satzverarbeitung
KW  - Cue-abhängiger Abruf
KW  - ähnlichkeitsbasierte Gedächtnisinterferenz
KW  - Eye-tracking
Y1  - 2022
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-556685
ER  -