TY - THES A1 - López Gambino, Maria Soledad T1 - Time Buying in Task-Oriented Spoken Dialogue Systems N2 - This dissertation focuses on the handling of time in dialogue. Specifically, it investigates how humans bridge time, or “buy time”, when they are expected to convey information that is not yet available to them (e.g. a travel agent searching for a flight in a long list while the customer is on the line, waiting). It also explores the feasibility of modeling such time-bridging behavior in spoken dialogue systems, and it examines how endowing such systems with more human-like time-bridging capabilities may affect humans’ perception of them. The relevance of time-bridging in human-human dialogue seems to stem largely from a need to avoid lengthy pauses, as these may cause both confusion and discomfort among the participants of a conversation (Levinson, 1983; Lundholm Fors, 2015). However, this avoidance of prolonged silence is at odds with the incremental nature of speech production in dialogue (Schlangen and Skantze, 2011): Speakers often start to verbalize their contribution before it is fully formulated, and sometimes even before they possess the information they need to provide, which may result in them running out of content mid-turn. In this work, we elicit conversational data from humans, to learn how they avoid being silent while they search for information to convey to their interlocutor. We identify commonalities in the types of resources employed by different speakers, and we propose a classification scheme. We explore ways of modeling human time-buying behavior computationally, and we evaluate the effect on human listeners of embedding this behavior in a spoken dialogue system. Our results suggest that a system using conversational speech to bridge time while searching for information to convey (as humans do) can provide a better experience in several respects than one which remains silent for a long period of time. However, not all speech serves this purpose equally: Our experiments also show that a system whose time-buying behavior is more varied (i.e. which exploits several categories from the classification scheme we developed and samples them based on information from human data) can prevent overestimation of waiting time when compared, for example, with a system that repeatedly asks the interlocutor to wait (even if these requests for waiting are phrased differently each time). Finally, this research shows that it is possible to model human time-buying behavior on a relatively small corpus, and that a system using such a model can be preferred by participants over one employing a simpler strategy, such as randomly choosing utterances to produce during the wait —even when the utterances used by both strategies are the same. N2 - Die zentralen Themen dieser Arbeit sind Zeit und Dialog. Insbesondere wird untersucht, wie Menschen Zeit gewinnen oder „Zeit kaufen“, wenn sie Informationen übermitteln müssen, die ihnen noch nicht zur Verfügung stehen (z. B. ein Reisebüroangestellter, der in einer langen Liste nach einem Flug sucht, während der Kunde am Telefon wartet). Außerdem wird untersucht, ob die Modellierung eines solchen Zeitüberbrückungsverhaltens in gesprochenen Dialogsystemen möglich ist und wie solche Fähigkeiten die Benutzererfahrung beeinflussen. Wir erheben Gesprächsdaten und ermitteln, wie die Sprecher den Dialog am Laufen halten, während sie nach Informationen für ihre(n) Gesprächspartner(in) suchen. Wir identifizieren Gemeinsamkeiten in den Ressourcen, die von verschiedenen Sprechern verwendet werden und schlagen ein Klassifizierungsschema vor. Wir erforschen Strategien, menschliches „Zeitüberbrückung“ zu modellieren, und wir bewerten die Auswirkungen dieses Verhaltens in ein gesprochenes Dialogsystem auf menschliche Zuhörer. T2 - Zeitgewinn in aufgabenorientierten Sprachdialogsystemen KW - dialogue system KW - Dialogsystem KW - linguistics KW - Linguistik KW - speech KW - Sprache KW - dialogue KW - Dialog KW - time-buying KW - Zeitgewinn Y1 - 2023 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-592806 ER - TY - THES A1 - Philipp, Mareike T1 - Quantifier scope ambiguities in English, German, and Asante Twi (Akan): structural and pragmatic factors T1 - Quantorenskopusambiguitäten im Englischen, Deutschen, und Asante Twi (Akan): Strukturelle und Pragmatische Faktoren N2 - This thesis is concerned with the phenomenon of quantifier scope ambiguities. This phenomenon has been researched extensively, both from a theoretical and from an empirical point of view. Nevertheless, there are still a number of under-researched topics in the field of quantifier scope, which will be the main focus of this thesis. I will take a closer look at three languages, English, German, and the Asante Twi dialect of Akan (Kwa, Niger-Kongo). The goal is a better understanding of the phenomenon of quantifier scope both within each language, as well as from a cross-linguistic perspective. First, this thesis will provide a series of experiments that allow a direct cross-linguistic comparison between English and German – two languages about which specific claims have been made in the literature. I will also provide exploratory research in the case of Asante Twi, where so far, no work has been dedicated specifically to the study of quantifier scope. The work on Asante Twi will go beyond quantifier scope and also target the quantifier and determiner system in general. The question is not only if particular scope readings are possible or not, but also which factors contribute to an increase or decrease of scope availability, and if there are factors that block certain scope readings altogether. While some of the results confirm and thereby strengthen previous claims, other results contradict general assumptions in the literature. This is particularly the case for inverse readings in German and inverse readings across clause-boundaries. N2 - Diese Arbeit befasst sich mit dem Phänomen Quantorenskopus und den daraus entstehenden Ambiguitäten. Dieses Phänomen wurde sowohl aus theoretischer als auch aus empirischer Sicht bereits umfangreich erforscht. Trotz alledem ist eine Reihe an Themenfeldern in diesem Bereich noch immer untererforscht, welche Hauptschwerpunkt dieser Arbeit sind. Konkret werden hier drei Sprachen genauer untersucht: Englisch, Deutsch und Asante Twi (Akan, Kwa, Niger-Kongo). Ziel ist ein besseres Verständnis von Skopusambiguitäten sowohl innerhalb dieser einzelnen Sprache als auch aus einer sprachübergreifenden Perspektive. Zum einen werden in dieser Arbeit eine Reihe von Experimenten präsentiert, die einen direkten sprachübergreifenden Vergleich zwischen Englisch und Deutsch ermöglichen – zwei Sprachen, über die in der Literatur konkrete Vorhersagen gemacht wurden. Darüberhinaus wird auch explorative Forschung im Fall von Asante Twi vorgestellt, wo dieses Phänomen bislang nicht speziell erforscht wurde. Die Arbeit zu Asante Twi wird über Skopusambiguitäten hinaus gehen und auch das Quantoren- und Determinierersystem im Allgemeinen betreffen. Die Fragestellung in diesem Buch ist nicht nur, ob bestimmte Skopus-Lesarten möglich sind oder nicht, sondern auch, welche Faktoren die Verfügbarkeit dieser Lesarten erhöhen oder reduzieren und ob es Faktoren gibt, die bestimmte Lesarten vollständig blockieren. Während einige vorherige Ergebnisse aus der Literatur repliziert werden und damit frühere Vorhersagen untermauern können, stellen andere der hier präsentierten Ergebnisse die bisherigen Annahmen in der Literatur in Frage. Dies betrifft insbesondere die Verfügbarkeit von inversen Lesarten im Deutschen sowie die Verfügbarkeit von inversen Lesarten im Kontext von Satzeinbettungen. KW - quantifiers KW - determiners KW - scope ambiguities KW - Quantoren KW - Determinierer KW - Skopusambiguitäten Y1 - 2023 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-612356 ER - TY - THES A1 - Wellmann, Caroline T1 - Early sensitivity to prosodic phrase boundary cues: Behavioral evidence from German-learning infants T1 - Frühkindliche Wahrnehmung prosodischer Grenzmarkierungen: Behaviorale Untersuchungen mit Deutsch lernenden Säuglingen N2 - This dissertation seeks to shed light on the relation of phrasal prosody and developmental speech perception in German-learning infants. Three independent empirical studies explore the role of acoustic correlates of major prosodic boundaries, specifically pitch change, final lengthening, and pause, in infant boundary perception. Moreover, it was examined whether the sensitivity to prosodic phrase boundary markings changes during the first year of life as a result of perceptual attunement to the ambient language (Aslin & Pisoni, 1980). Using the headturn preference procedure six- and eight-month-old monolingual German-learning infants were tested on their discrimination of two different prosodic groupings of the same list of coordinated names either with or without an internal IPB after the second name, that is, [Moni und Lilli] [und Manu] or [Moni und Lilli und Manu]. The boundary marking was systematically varied with respect to single prosodic cues or specific cue combinations. Results revealed that six- and eight-month-old German-learning infants successfully detect the internal prosodic boundary when it is signaled by all the three main boundary cues pitch change, final lengthening, and pause. For eight-, but not for six-month-olds, the combination of pitch change and final lengthening, without the occurrence of a pause, is sufficient. This mirrors an adult-like perception by eight-months (Holzgrefe-Lang et al., 2016). Six-month-olds detect a prosodic phrase boundary signaled by final lengthening and pause. The findings suggest a developmental change in German prosodic boundary cue perception from a strong reliance on the pause cue at six months to a differentiated sensitivity to the more subtle cues pitch change and final lengthening at eight months. Neither for six- nor for eight-month-olds the occurrence of pitch change or final lengthening as single cues is sufficient, similar to what has been observed for adult speakers of German (Holzgrefe-Lang et al., 2016). The present dissertation provides new scientific knowledge on infants’ sensitivity to individual prosodic phrase boundary cues in the first year of life. Methodologically, the studies are pathbreaking since they used exactly the same stimulus materials – phonologically thoroughly controlled lists of names – that have also been used with adults (Holzgrefe-Lang et al., 2016) and with infants in a neurophysiological paradigm (Holzgrefe-Lang, Wellmann, Höhle, & Wartenburger, 2018), allowing for comparisons across age (six/ eight months and adults) and method (behavioral vs. neurophysiological methods). Moreover, materials are suited to be transferred to other languages allowing for a crosslinguistic comparison. Taken together with a study with similar French materials (van Ommen et al., 2020) the observed change in sensitivity in German-learning infants can be interpreted as a language-specific one, from an initial language-general processing mechanism that primarily focuses on the presence of pauses to a language-specific processing that takes into account prosodic properties available in the ambient language. The developmental pattern is discussed as an interplay of acoustic salience, prosodic typology (prosodic regularity) and cue reliability. N2 - Die Dissertation befasst sich mit der Bedeutung individueller prosodischer Hinweise für die Wahrnehmung einer prosodischen Phrasengrenze bei deutschsprachig aufwachsenden Säuglingen. In drei Studien wurde mit behavioralen Untersuchungen der Frage nachgegangen, welche Bedeutung die akustischen Merkmale Tonhöhenveränderung, finale Dehnung und das Auftreten von Pausen für die Erkennung einer prosodischen Grenze haben. Zudem wurde hinterfragt, ob sich die Sensitivität für diese prosodischen Grenzmarkierungen im ersten Lebensjahr verändert und einer perzeptuellen Reorganisation, also einer Anpassung an die Muttersprache (Attunement Theorie, Aslin & Pisoni, 1980), unterliegt. Mithilfe der Headturn Preference Procedure wurde getestet, ob 6 und 8 Monate alte Deutsch lernende Säuglinge zwei verschiedene prosodische Gruppierungen einer Aufzählung von Namen diskriminieren können (mit oder ohne eine interne prosodische Grenze, [Moni und Lilli] [und Manu] vs. [Moni und Lilli und Manu]). Die Grenze wurde bezüglich des Auftretens einzelner prosodischer Hinweise oder Kombinationen von Hinweisen systematisch variiert. Die Ergebnisse zeigen, dass sowohl 6 als auch 8 Monate alte Deutsch lernende Säuglinge die interne prosodische Grenze in der Aufzählung erkennen, wenn sie durch alle drei Hinweise – Tonhöhenveränderung, finale Dehnung und das Auftreten einer Pause – markiert ist. Darüber hinaus zeigte sich, dass für 8, aber nicht für 6, Monate alte Säuglinge die Kombination aus Tonhöhe und finaler Dehnung ohne Pause ausreichend ist. 6 Monate alte Säuglinge erkennen eine Grenze, wenn sie durch eine Pause und finale Dehnung markiert ist. Damit zeigt sich eine Entwicklung der Sensitivität für prosodische Grenzmarkierungen von 6 zu 8 Monaten – weg von der Notwendigkeit der Pause hin zu einer differenzierten Wahrnehmung subtiler Hinweise wie Tonhöhe und finale Dehnung. Weder für 6 noch für 8 Monate alte Säuglinge ist die Markierung durch einen einzelnen Hinweis (Tonhöhe oder finale Dehnung) ausreichend. Dies deckt sich mit dem Verhaltensmuster erwachsener deutschsprachiger Hörer in einer Aufgabe zur prosodischen Strukturierung (Holzgrefe-Lang et al., 2016). Die vorgelegte Dissertation beleuchtet erstmalig für den frühen Erwerb des Deutschen die Bedeutung einzelner prosodischer Hinweise an Phrasengrenzen. Hierbei ist die Art der verwendeten Stimuli neu: phonologisch sorgfältig kontrollierte Aufzählungen von Namen, in denen einzelne prosodische Hinweise fein akustisch manipuliert werden können. Zudem kann dieses Material ideal in Untersuchungen mit anderen Methoden (z.B. EEG) eingesetzt werden und auf weitere Altersgruppen (Erwachsene) und andere Sprachen transferiert werden. Dies ermöglicht den direkten Vergleich der Ergebnisse zu denen anderer Studien mit ähnlichem Stimulusmaterial (Holzgrefe-Lang et al., 2016, 2018; van Ommen et al., 2020) und erlaubt die Interpretation einer sprachspezifischen Entwicklung. Das beobachtete Entwicklungsmuster wird als Produkt eines Wechselspiels von akustischer Salienz, prosodischer Typologie (prosodische Regularität) und Zuverlässigkeit eines prosodischen Hinweises (cue reliability) diskutiert. KW - prosody KW - language acquisition KW - infants KW - prosodic boundary cues KW - prosodic phrase boundary KW - perceptual attunement KW - Prosodie KW - Spracherwerb KW - Säuglinge KW - prosodische Grenzmarkierungen KW - prosodische Phrasengrenze KW - perzeptuelle Reorganisation Y1 - 2023 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-573937 ER - TY - THES A1 - Yadav, Himanshu T1 - A computational evaluation of feature distortion and cue weighting in sentence comprehension T1 - Eine komputationale Evaluation von Feature-Verfälschung und Cue-Gewichtung in der Satzverarbeitung N2 - Successful sentence comprehension requires the comprehender to correctly figure out who did what to whom. For example, in the sentence John kicked the ball, the comprehender has to figure out who did the action of kicking and what was being kicked. This process of identifying and connecting the syntactically-related words in a sentence is called dependency completion. What are the cognitive constraints that determine dependency completion? A widely-accepted theory is cue-based retrieval. The theory maintains that dependency completion is driven by a content-addressable search for the co-dependents in memory. The cue-based retrieval explains a wide range of empirical data from several constructions including subject-verb agreement, subject-verb non-agreement, plausibility mismatch configurations, and negative polarity items. However, there are two major empirical challenges to the theory: (i) Grammatical sentences’ data from subject-verb number agreement dependencies, where the theory predicts a slowdown at the verb in sentences like the key to the cabinet was rusty compared to the key to the cabinets was rusty, but the data are inconsistent with this prediction; and, (ii) Data from antecedent-reflexive dependencies, where a facilitation in reading times is predicted at the reflexive in the bodybuilder who worked with the trainers injured themselves vs. the bodybuilder who worked with the trainer injured themselves, but the data do not show a facilitatory effect. The work presented in this dissertation is dedicated to building a more general theory of dependency completion that can account for the above two datasets without losing the original empirical coverage of the cue-based retrieval assumption. In two journal articles, I present computational modeling work that addresses the above two empirical challenges. To explain the grammatical sentences’ data from subject-verb number agreement dependencies, I propose a new model that assumes that the cue-based retrieval operates on a probabilistically distorted representation of nouns in memory (Article I). This hybrid distortion-plus-retrieval model was compared against the existing candidate models using data from 17 studies on subject-verb number agreement in 4 languages. I find that the hybrid model outperforms the existing models of number agreement processing suggesting that the cue-based retrieval theory must incorporate a feature distortion assumption. To account for the absence of facilitatory effect in antecedent-reflexive dependen� cies, I propose an individual difference model, which was built within the cue-based retrieval framework (Article II). The model assumes that individuals may differ in how strongly they weigh a syntactic cue over a number cue. The model was fitted to data from two studies on antecedent-reflexive dependencies, and the participant-level cue-weighting was estimated. We find that one-fourth of the participants, in both studies, weigh the syntactic cue higher than the number cue in processing reflexive dependencies and the remaining participants weigh the two cues equally. The result indicates that the absence of predicted facilitatory effect at the level of grouped data is driven by some, not all, participants who weigh syntactic cues higher than the number cue. More generally, the result demonstrates that the assumption of differential cue weighting is important for a theory of dependency completion processes. This differential cue weighting idea was independently supported by a modeling study on subject-verb non-agreement dependencies (Article III). Overall, the cue-based retrieval, which is a general theory of dependency completion, needs to incorporate two new assumptions: (i) the nouns stored in memory can undergo probabilistic feature distortion, and (ii) the linguistic cues used for retrieval can be weighted differentially. This is the cumulative result of the modeling work presented in this dissertation. The dissertation makes an important theoretical contribution: Sentence comprehension in humans is driven by a mechanism that assumes cue-based retrieval, probabilistic feature distortion, and differential cue weighting. This insight is theoretically important because there is some independent support for these three assumptions in sentence processing and the broader memory literature. The modeling work presented here is also methodologically important because for the first time, it demonstrates (i) how the complex models of sentence processing can be evaluated using data from multiple studies simultaneously, without oversimplifying the models, and (ii) how the inferences drawn from the individual-level behavior can be used in theory development. N2 - Bei der Satzverarbeitung muss der Leser richtig herausfinden, wer wem was angetan hat. Zum Beispiel muss der Leser in dem Satz „John hat den Ball getreten“ herausfinden, wer tat die Aktion des Tretens und was getreten wurde. Dieser Prozess des Identifizierens und Verbindens der syntaktisch verwandte Wörter in einem Satz nennt man Dependency-Completion. Was sind die kognitiven Mechanismen, die Dependency-Completion bestimmen? Eine weithin akzeptierte Theorie ist der Cue-based retrieval. Die Theorie besagt, dass die Dependency-Completion durch eine inhaltsadressierbare Suche nach der vorangetrieben wird Co-Abhängige im Gedächtnis. Der Cue-basierte Abruf erklärt ein breites Spektrum an empirischen Daten mehrere Konstruktionen, darunter Subjekt-Verb-Übereinstimmung, Subjekt-Verb-Nichtübereinstimmung, Plausibilität Mismatch-Konfigurationen und Elemente mit negativer Polarität. Es gibt jedoch zwei große empirische Herausforderungen für die Theorie: (i) Grammatische Sätze Daten aus Subjekt-Verb-Nummer-Dependency, bei denen die Theorie eine Verlangsamung vorhersagt das Verb in Sätzen wie „the key to the cabinet was rusty“ im Vergleich zu „the key to the cabinets was rusty“, aber die Daten stimmen nicht mit dieser Vorhersage überein; und (ii) Daten von Antezedenz-Reflexiv Strukturen, wo eine Leseerleichterung beim reflexiven „the bodybuilder who worked with the trainers injured themselves“ vs. „the bodybuilder who worked with the trainers injured themselves", aber die Daten zeigen keine vermittelnde Wirkung. Die in dieser Dissertation vorgestellte Arbeit widmet sich dem Aufbau einer allgemeineren Theorie von Dependency-Completion, die die beiden oben genannten Datensätze berücksichtigen kann, ohne das Original zu verlieren empirische Abdeckung der Cue-based Retrieval-Annahme. In zwei Zeitschriftenartikeln stelle ich Arbeiten zur Computermodellierung vor, die sich mit den beiden oben genannten empirischen Herausforderungen befassen. Um die Daten der grammatikalischen Sätze aus den Abhängigkeiten der Subjekt-Verb-Nummer-Übereinstimmung zu erklären, schlage ich ein neues Modell vor, das davon ausgeht, dass der Cue-basierte Abruf probabilistisch funktioniert verzerrte Darstellung von Substantiven im Gedächtnis (Artikel I). Dieses hybride Distortion-plus-Retrieval-Modell wurde anhand von Daten aus 17 Studien zu Subjekt-Verb mit den bestehenden Kandidatenmodellen verglichen Nummernvereinbarung in 4 Sprachen. Ich finde, dass das Hybridmodell die bestehenden Modelle übertrifft der Nummernvereinbarungsverarbeitung, was darauf hindeutet, dass die Cue-based Retrieval-Theorie Folgendes umfassen muss: a Annahme von Feature-Verfälschung. Um das Fehlen eines unterstützenden Effekts in antezedens-reflexiven Abhängigkeiten zu berücksichtigen, schlage ich ein individuelles Differenzmodell vor, das innerhalb des Cue-based Retrieval-Frameworks erstellt wurde (Artikel II). Das Modell geht davon aus, dass Individuen sich darin unterscheiden können, wie stark sie eine Syntax gewichten Cue über einem Nummern-Cue. Das Modell wurde an Daten aus zwei Studien zum Antezedenz-Reflexiv angepasst Abhängigkeiten, und die Cue-Gewichtung auf Teilnehmerebene wurde geschätzt. Wir finden, dass ein Viertel von Die Teilnehmer in beiden Studien gewichten bei der Verarbeitung den syntaktischen Cue höher als den numerischen Cue reflexive Abhängigkeiten und die verbleibenden Teilnehmer gewichten die beiden Cue gleichermaßen. Das Ergebnis weist darauf hin, dass das Fehlen des prognostizierten Erleichterungseffekts auf der Ebene der gruppierten Daten von einigen, nicht alle Teilnehmer, die syntaktische Cue höher gewichten als Zahlenhinweise. Allgemeiner gesagt, die Das Ergebnis zeigt, dass die Annahme einer differentiellen Hinweisgewichtung wichtig für eine Theorie von ist Dependency-Completion. Diese Idee der differentiellen Cue-Gewichtung wurde unabhängig unterstützt durch eine Modellierungsstudie zu Subjekt-Verb-Nichteinigungsabhängigkeiten (Artikel III). Insgesamt benötigt der Cue-basierte Abruf, der eine allgemeine Theorie der Abhängigkeitsvervollständigung ist um zwei neue Annahmen aufzunehmen: (i) die im Gedächtnis gespeicherten Substantive können einer Wahrscheinlichkeitsanalyse unterzogen werden Feature-Verfälschung, und (ii) die für den Abruf verwendeten sprachlichen Cue können unterschiedlich gewichtet werden. Das ist das kumulative Ergebnis der in dieser Dissertation vorgestellten Modellierungsarbeit.Die Dissertation leistet einen wichtigen theoretischen Beitrag: Satzverständnis in Der Mensch wird von einem Mechanismus getrieben, der einen hinweisbasierten Abruf, eine probabilistische Merkmalsverzerrung und eine differentielle Hinweisgewichtung annimmt. Diese Einsicht ist theoretisch wichtig, weil es einige gibt unabhängige Unterstützung für diese drei Annahmen in der Satzverarbeitung und im weiteren Gedächtnis Literatur. Die hier vorgestellten Modellierungsarbeiten sind auch methodisch wichtig, weil für die Zum ersten Mal wird gezeigt, (i) wie die komplexen Modelle der Satzverarbeitung evaluiert werden können Daten aus mehreren Studien gleichzeitig zu verwenden, ohne die Modelle zu stark zu vereinfachen, und (ii) wie die Schlussfolgerungen aus dem Verhalten auf individueller Ebene können in der Theorieentwicklung verwendet werden. KW - sentence comprehension KW - individual differences KW - cue-based retrieval KW - memory distortion KW - Approximate Bayesian Computation KW - cue reliability KW - ungefähre Bayessche Komputation KW - Cue-Gewichtung KW - Cue-basierter Retrieval KW - individuelle Unterschiede KW - Darstellung Verfälschung KW - Satzverarbeitung Y1 - 2023 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-585055 ER -