@phdthesis{Yadav2023,
  author    = {Yadav, Himanshu},
  title     = {A computational evaluation of feature distortion and cue weighting in sentence comprehension},
  doi       = {10.25932/publishup-58505},
  url       = {http://nbn-resolving.de/urn:nbn:de:kobv:517-opus4-585055},
  school      = {Universit{\"a}t Potsdam},
  pages     = {iv, 115},
  year      = {2023},
  abstract  = {Successful sentence comprehension requires the comprehender to correctly figure out who did what to whom. For example, in the sentence John kicked the ball, the comprehender has to figure out who did the action of kicking and what was being kicked. This process of identifying and connecting the syntactically-related words in a sentence is called dependency completion. What are the cognitive constraints that determine dependency completion? A widely-accepted theory is cue-based retrieval. The theory maintains that dependency completion is driven by a content-addressable search for the co-dependents in memory. The cue-based retrieval explains a wide range of empirical data from several constructions including subject-verb agreement, subject-verb non-agreement, plausibility mismatch configurations, and negative polarity items. However, there are two major empirical challenges to the theory: (i) Grammatical sentences' data from subject-verb number agreement dependencies, where the theory predicts a slowdown at the verb in sentences like the key to the cabinet was rusty compared to the key to the cabinets was rusty, but the data are inconsistent with this prediction; and, (ii) Data from antecedent-reflexive dependencies, where a facilitation in reading times is predicted at the reflexive in the bodybuilder who worked with the trainers injured themselves vs. the bodybuilder who worked with the trainer injured themselves, but the data do not show a facilitatory effect. The work presented in this dissertation is dedicated to building a more general theory of dependency completion that can account for the above two datasets without losing the original empirical coverage of the cue-based retrieval assumption. In two journal articles, I present computational modeling work that addresses the above two empirical challenges. To explain the grammatical sentences' data from subject-verb number agreement dependencies, I propose a new model that assumes that the cue-based retrieval operates on a probabilistically distorted representation of nouns in memory (Article I). This hybrid distortion-plus-retrieval model was compared against the existing candidate models using data from 17 studies on subject-verb number agreement in 4 languages. I find that the hybrid model outperforms the existing models of number agreement processing suggesting that the cue-based retrieval theory must incorporate a feature distortion assumption. To account for the absence of facilitatory effect in antecedent-reflexive dependen� cies, I propose an individual difference model, which was built within the cue-based retrieval framework (Article II). The model assumes that individuals may differ in how strongly they weigh a syntactic cue over a number cue. The model was fitted to data from two studies on antecedent-reflexive dependencies, and the participant-level cue-weighting was estimated. We find that one-fourth of the participants, in both studies, weigh the syntactic cue higher than the number cue in processing reflexive dependencies and the remaining participants weigh the two cues equally. The result indicates that the absence of predicted facilitatory effect at the level of grouped data is driven by some, not all, participants who weigh syntactic cues higher than the number cue. More generally, the result demonstrates that the assumption of differential cue weighting is important for a theory of dependency completion processes. This differential cue weighting idea was independently supported by a modeling study on subject-verb non-agreement dependencies (Article III). Overall, the cue-based retrieval, which is a general theory of dependency completion, needs to incorporate two new assumptions: (i) the nouns stored in memory can undergo probabilistic feature distortion, and (ii) the linguistic cues used for retrieval can be weighted differentially. This is the cumulative result of the modeling work presented in this dissertation. The dissertation makes an important theoretical contribution: Sentence comprehension in humans is driven by a mechanism that assumes cue-based retrieval, probabilistic feature distortion, and differential cue weighting. This insight is theoretically important because there is some independent support for these three assumptions in sentence processing and the broader memory literature. The modeling work presented here is also methodologically important because for the first time, it demonstrates (i) how the complex models of sentence processing can be evaluated using data from multiple studies simultaneously, without oversimplifying the models, and (ii) how the inferences drawn from the individual-level behavior can be used in theory development.},
  language  = {en}
}
@phdthesis{Gollrad2013,
  author    = {Gollrad, Anja},
  title     = {Prosodic cue weighting in sentence comprehension},
  url       = {http://nbn-resolving.de/urn:nbn:de:kobv:517-opus4-81954},
  school      = {Universit{\"a}t Potsdam},
  pages     = {148},
  year      = {2013},
  abstract  = {Gegenstand der Dissertation ist die Untersuchung der Gewichtung prosodischer Korrelate der Phrasierung im Deutschen, insbesondere der Dauer- und Grundfrequenzeigenschaften auf der Ebene der phonologischen Phrase (φ) und der Intonationsphrase (ι). F{\"u}r die prosodische Dom{\"a}ne der phonologischen Phrase und der Intonationsphrase gilt als belegt, dass sie h{\"a}upts{\"a}chlich durch phonetische Parameter der pr{\"a}finalen Dehnung (Lehiste, 1973; Klatt, 1976; Price et al., 1991; Turk \& White, 1999), der Pausendauer (Fant \& Kruckenberg, 1996) und der Ver{\"a}nderung der Grundfrequenz (Pierrehumbert, 1980) ausgedr{\"u}ckt werden, wobei die phonetischen grenzmarkierenden Eigenschaften eher quantitativer als qualitativer Natur sind. Ebenfalls ist bekannt, dass auf der anderen Seite H{\"o}rer diese phonetischen Eigenschaften der Sprecher nutzen, um die prosodische Struktur einer {\"A}ußerung zu ermitteln (Snedeker \& Trueswell, 2003; Kraljic \& Brennan, 2005). Perzeptuelle Evidenz aus dem Englischen und Niederl{\"a}ndischen deuten allerdings darauf hin, dass sich Sprachen hinsichtlich der entscheidenden Korrelate, die f{\"u}r die Perzeption der Dom{\"a}nen konsultiert werden, unterscheiden (Aasland \& Baum, 2003; Sanderman \& Collier, 1997; Scott, 1982; Streeter, 1978). Die grenzmarkierenden phonetischen Korrelate der Dom{\"a}nen werden in der Perzeption unterschiedlich stark gewichtet, was sich im Konzept eines sprachspezifischen prosodischen cue weightings ausdr{\"u}ckt. F{\"u}r das Deutsche ist allerdings nicht hinreichend bekannt, welche dieser drei phonetischen Parameter die wichtigste Rolle f{\"u}r die Perzeption der phonologischen Phrasengrenze und der Intonationsphrasengrenze spielt. Ziel der Dissertation war es, diejenigen phonetischen Merkmale zu identifizieren, die f{\"u}r die Perzeption der phonologischen Phrasengrenze und der Intonationsphrasengrenze entscheidend sind und sich somit f{\"u}r die Bildung der jeweiligen prosodischen Phrasengrenze als notwendig herausstellen. Die Identifikation und Gewichtung eines phonetischen Merkmals erfolgte in der vorliegenden Arbeit durch die Effekte prosodischer Manipulation der phonetischen Korrelate an phonologischen Phrasengrenzen und Intonationsphrasengrenzen auf die Disambiguierung lokaler syntaktischer Ambiguit{\"a}ten in der Perzeption. Der Einfluss einzelner phonetischer Merkmale wurde in einem forced-choice Experiment evaluiert, bei dem H{\"o}rern syntaktisch ambige Satzfragmente auditiv pr{\"a}sentiert wurden und ihnen anschließend die Aufgabe zukam, aus einer Auswahl an disambiguierenden Satzvervollst{\"a}ndigung zu w{\"a}hlen. Die Anzahl der ausgew{\"a}hlten Satzvervollst{\"a}ndigungen pro Satzbedingung {\"a}nderte sich in Abh{\"a}ngigkeit der prosodischen Manipulation der pr{\"a}finalen Dehnung, der Pausendauer und der Grundfrequenz, wodurch der Einfluss eines einzelnen phonetischen Merkmals auf den Disambiguierungsprozess sichtbar wurde. Ein phonetischer Parameter wurde genau dann als notwendig klassifiziert, wenn sich durch seine Manipulation die F{\"a}higkeit zur Disambiguierung der syntaktischen Strukturen signifikant reduzierte, oder g{\"a}nzlich scheiterte, und somit die Wahrnehmung prosodischer Kategorien beinflusst wurde (Heldner, 2001). Hat sich in der Perzeption ein phonetisches Merkmal als notwendig herausgestellt, wurde nachfolgend eine optimalit{\"a}tstheoretische Modellierung vorgeschlagen, die die phonetischen Eigenschaften auf eine (abstrakte) phonologische Strukturerstellung beschreibt. Dieser Verarbeitungsschritt entspricht dem Teilbereich des Perzeptionsprozesses, der in Boersma \& Hamann (2009), Escudero (2009) und F{\´e}ry et al. (2009) unter anderen als Phonetik-Phonologie-Mapping beschrieben wird. Die Dissertation hat folgende Hauptergebnisse hervorgebracht: (1) F{\"u}r die Perzeption phonologischer Phrasengrenzen und Intonationsphrasengrenzen werden nicht alle messbaren phonetischen Grenzmarkierungen gleichermaßen stark genutzt. Das phonetische Merkmal der pr{\"a}finalen Dehnung ist auf der Ebene der kleineren prosodischen Dom{\"a}ne, der phonologischen Phrase, notwendig. Die Information der Grundfrequenz in der Form von Grenzt{\"o}nen ist in der gr{\"o}ßeren Dom{\"a}ne der Intonationsphrase notwendig und damit ausschlaggebend f{\"u}r die Perzeption der prosodischen Phrasengrenze. (2) Auf der Ebene der φ-Phrase werden phonetische Eigenschaften der segmentalen Dauer in Form pr{\"a}finalen Dehnung zur Bildung abstrakter phonologischer Repr{\"a}sentationen herangezogen werden. L{\"a}ngenconstraints schreiben syntaktische Konstituenten aufgrund ihrer Inputdauern einer prosodischen Kategorie zu. Inputdauern der ersten Nominalphrase von 500ms und mehr signalisieren Finalit{\"a}t und sind durch eine φ- Grenze am rechten Rand markiert. Inputdauern von 400ms und weniger signalisieren Kontinuit{\"a}t und werden durch das Ausbleiben einer φ-Grenze am rechten Rand der ersten Nominalphrase markiert. Inputdauern, die zwischen den kritischen L{\"a}ngen von 400ms und 500ms variieren sind bez{\"u}glich der Bildung von φ- Grenzen ambig und k{\"o}nnen in der Perzeption nicht eindeutig disambiguiert werden. (3) Auf der Ebene der ι-Phrase wird die Bildung einer prosodischen Struktur durch die reine tonale Kontur (steigend oder fallend) an der ersten Nominalphrase gelenkt. Eine fallende Grundfrequenzkontur an der ersten Nominalphrase signalisiert Finalit{\"a}t und wird durch eine ι-Grenze am rechten Rand markiert. Eine steigende Kontur an der ersten Nominalphrase signalisiert phrasale Kontinuit{\"a}t und ist bei den vorliegenden S{\"a}tzen der Genitivbedingung gerade durch das Ausbleiben einer ι-Grenze auf der phonologischen Repr{\"a}sentationseben gekennzeichnet.},
  language  = {en}
}