Refine
Has Fulltext
- yes (47)
Year of publication
- 2008 (47) (remove)
Document Type
- Postprint (22)
- Conference Proceeding (18)
- Article (7)
Is part of the Bibliography
- no (47) (remove)
Keywords
- Demokratie (2)
- EU (2)
- Russland (2)
- Türkei (2)
- Abrüstung (1)
- Außenpolitik (1)
- Bryophytes (1)
- Gemeinsame Außen- und Sicherheitspolitik (1)
- Geopolitik (1)
- Innenpolitik (1)
Institute
- Extern (47) (remove)
Parsing costs as predictors of reading difficulty: An evaluation using the Potsdam Sentence Corpus
(2008)
The surprisal of a word on a probabilistic grammar constitutes a promising complexity metric for human sentence comprehension difficulty. Using two different grammar types, surprisal is shown to have an effect on fixation durations and regression probabilities in a sample of German readers’ eye movements, the Potsdam Sentence Corpus. A linear mixed-effects model was used to quantify the effect of surprisal while taking into account unigram and bigram frequency, word length, and empirically-derived word predictability; the so-called “early” and “late” measures of processing difficulty both showed an effect of surprisal. Surprisal is also shown to have a small but statistically non-significant effect on empirically-derived predictability itself. This work thus demonstrates the importance of including parsing costs as a predictor of comprehension difficulty in models of reading, and suggests that a simple identification of syntactic parsing costs with early measures and late measures with durations of post-syntactic events may be difficult to uphold.
The boundary paradigm (Rayner, 1975) with a novel preview manipulation was used to examine the extent of parafoveal processing of words to the right of fixation. Words n+1 and n+2 had either correct or incorrect previews prior to fixation (prior to crossing the boundary location). In addition, the manipulation utilized either a high or low frequency word in word n+1 location on the assumption that it would be more likely that n+2 preview effects could be obtained when word n+1 was high frequency. The primary findings were that there was no evidence for a preview benefit for word n+2 and no evidence for parafoveal-on-foveal effects when word n+1 is at least four letters long. We discuss implications for models of eye-movement control in reading.
In this paper, we present a finite-state approach to constituency and therewith an analysis of coordination phenomena involving so-called non-constituents. We show that non-constituents can be seen as parts of fully-fledged constituents and therefore be coordinated in the same way. We have implemented an algorithm based on finite state automata that generates an LFG grammar assigning valid analyses to non-constituent coordination structures in the German language.
Generalized Two-Level Grammar (GTWOL) provides a new method for compilation of parallel replacement rules into transducers. The current paper identifies the role of generalized lenient composition (GLC) in this method. Thanks to the GLC operation, the compilation method becomes bipartite and easily extendible to capture various application modes. In the light of three notions of obligatoriness, a modification to the compilation method is proposed. We argue that the bipartite design makes implementation of parallel obligatoriness, directionality, length and rank based application modes extremely easy, which is the main result of the paper.
Morphological analyses based on word syntax approaches can encounter difficulties with long distance dependencies. The reason is that in some cases an affix has to have access to the inner structure of the form with which it combines. One solution is the percolation of features from ther inner morphemes to the outer morphemes with some process of feature unification. However, the obstacle of percolation constraints or stipulated features has lead some linguists to argue in favour of other frameworks such as, e.g., realizational morphology or parallel approaches like optimality theory. This paper proposes a linguistic analysis of two long distance dependencies in the morphology of Russian verbs, namely secondary imperfectivization and deverbal nominalization.We show how these processes can be reanalysed as local dependencies. Although finitestate frameworks are not bound by such linguistically motivated considerations, we present an implementation of our analysis as proposed in [1] that does not complicate the grammar or enlarge the network unproportionally.
The emergence of information extraction (IE) oriented pattern engines has been observed during the last decade. Most of them exploit heavily finite-state devices. This paper introduces ExPRESS – a new extraction pattern engine, whose rules are regular expressions over flat feature structures. The underlying pattern language is a blend of two previously introduced IE oriented pattern formalisms, namely, JAPE, used in the widely known GATE system, and the unificationbased XTDL formalism used in SProUT. A brief and technical overview of ExPRESS, its pattern language and the pool of its native linguistic components is given. Furthermore, the implementation of the grammar interpreter is addressed too.
In this work an extension of CSSR algorithm using Maximum Entropy Models is introduced. Preliminary experiments to perform Named Entity Recognition with this new system are presented.
In the last years, statistical machine translation has already demonstrated its usefulness within a wide variety of translation applications. In this line, phrase-based alignment models have become the reference to follow in order to build competitive systems. Finite state models are always an interesting framework because there are well-known efficient algorithms for their representation and manipulation. This document is a contribution to the evolution of finite state models towards a phrase-based approach. The inference of stochastic transducers that are based on bilingual phrases is carefully analysed from a finite state point of view. Indeed, the algorithmic phenomena that have to be taken into account in order to deal with such phrase-based finite state models when in decoding time are also in-depth detailed.
Temporal propositions are mapped to sets of strings that witness (in a precise sense) the propositions over discrete linear Kripke frames. The strings are collected into regular languages to ensure the decidability of entailments given by inclusions between languages. (Various notions of bounded entailment are shown to be expressible as language inclusions.) The languages unwind computations implicit in the logical (and temporal) connectives via a system of finite-state constraints adapted from finite-state morphology. Applications to Hybrid Logic and non-monotonic inertial reasoning are briefly considered.
This paper presents a system for the detection and correction of syntactic errors. It combines a robust morphosyntactic analyser and two groups of finite-state transducers specified using the Xerox Finite State Tool (xfst). One of the groups is used for the description of syntactic error patterns while the second one is used for the correction of the detected errors. The system has been tested on a corpus of real texts, containing both correct and incorrect sentences, with good results.
This paper describes the key aspects of the system SynCoP (Syntactic Constraint Parser) developed at the Berlin-Brandenburgische Akademie der Wissenschaften. The parser allows to combine syntactic tagging and chunking by means of constraint grammar using weighted finite state transducers (WFST). Chunks are interpreted as local dependency structures within syntactic tagging. The linguistic theories are formulated by criteria which are formalized by a semiring; these criteria allow structural preferences and gradual grammaticality. The parser is essentially a cascade of WFSTs. To find the most likely syntactic readings a best-path search is used.
We present an algorithm that computes a function that assigns consecutive integers to trees recognized by a deterministic, acyclic, finite-state, bottom-up tree automaton. Such function is called minimal perfect hashing. It can be used to identify trees recognized by the automaton. Its value may be seen as an index in some other data structures. We also present an algorithm for inverted hashing.
We introduce and discuss a number of issues that arise in the process of building a finite-state morphological analyzer for Urdu, in particular issues with potential ambiguity and non-concatenative morphology. Our approach allows for an underlyingly similar treatment of both Urdu and Hindi via a cascade of finite-state transducers that transliterates the very different scripts into a common ASCII transcription system. As this transliteration system is based on the XFST tools that the Urdu/Hindi common morphological analyzer is also implemented in, no compatibility problems arise.
Finite state methods for natural language processing often require the construction and the intersection of several automata. In this paper, we investigate the question of determining the best order in which these intersections should be performed. We take as an example lexical disambiguation in polarity grammars. We show that there is no efficient way to minimize the state complexity of these intersections.
Since Harris’ parser in the late 50s, multiword units have been progressively integrated in parsers. Nevertheless, in the most part, they are still restricted to compound words, that are more stable and less numerous. Actually, language is full of semi-fixed expressions that also form basic semantic units: semi-fixed adverbial expressions (e.g. time), collocations. Like compounds, the identification of these structures limits the combinatorial complexity induced by lexical ambiguity. In this paper, we detail an experiment that largely integrates these notions in a finite-state procedure of segmentation into super-chunks, preliminary to a parser.We show that the chunker, developped for French, reaches 92.9% precision and 98.7% recall. Moreover, multiword units realize 36.6% of the attachments within nominal and prepositional phrases.
This paper describes a two-level formalism where feature structures are used in contextual rules. Whereas usual two-level grammars describe rational sets over symbol pairs, this new formalism uses tree structured regular expressions. They allow an explicit and precise definition of the scope of feature structures. A given surface form may be described using several feature structures. Feature unification is expressed in contextual rules using variables, like in a unification grammar. Grammars are compiled in finite state multi-tape transducers.
This article describes a HMM-based word-alignment method that can selectively enforce a contiguity constraint. This method has a direct application in the extraction of a bilingual terminological lexicon from a parallel corpus, but can also be used as a preliminary step for the extraction of phrase pairs in a Phrase-Based Statistical Machine Translation system. Contiguous source words composing terms are aligned to contiguous target language words. The HMM is transformed into a Weighted Finite State Transducer (WFST) and contiguity constraints are enforced by specific multi-tape WFSTs. The proposed method is especially suited when basic linguistic resources (morphological analyzer, part-of-speech taggers and term extractors) are available for the source language only.
Nested complementation plays an important role in expressing counter- i.e. star-free and first-order definable languages and their hierarchies. In addition, methods that compile phonological rules into finite-state networks use double-nested complementation or “double negation”. This paper reviews how the double-nested complementation extends to a relatively new operation, generalized restriction (GR), coined by the author (Yli-Jyrä and Koskenniemi 2004). This operation encapsulates a double-nested complementation and elimination of a concatenation marker, diamond, whose finite occurrences align concatenations in the arguments of the operation. The paper demonstrates that the GR operation has an interesting potential in expressing regular languages, various kinds of grammars, bimorphisms and relations. This motivates a further study of optimized implementation of the operator.
Blattgold : Pole Position
(2008)
Die Zukunft Osteuropas entscheidet sich im Spannungsfeld zwischen Russland und der EU. Die dortigen Staaten lösen sich aus der einseitigen Abhängigkeit eines erstarkten und seine Interessen im postsowjetischen Raum verteidigenden Russland. Ob die EU diese Chance in Osteuropa nutzen kann, hängt davon ab, ob sich die Mitgliedstaaten bereitfinden, ihre wirtschaftlichen und geopolitischen Interessen in der Region gemeinsam zu verfolgen.
Türkei : Daten und Fakten
(2008)
Atomare, biologische und chemische Waffen bedrohen das Überleben der Menschheit. Friedens- und Konfliktforscher Wolfgang Kötter aus Potsdam untersucht die differenzierten Ergebnisse bei der Beseitigung dieser Gefahr. Während die chemische Abrüstung, wenn auch mit Verzögerungen, voran kommt, fehlt dem Verbot der B-Waffen ein wirksames Kontrollinstrument. Atomare Waffen erleben sogar eine Renaissance und das nukleare Nichtverbreitungsregime droht zu zerbrechen.
Demokratie, nicht Laizismus um jeden Preis : zu den inneren Auseinandersetzungen in der Türkei
(2008)
Die innergesellschaftlichen Auseinandersetzungen in der Türkei drehen sich nicht darum, ob der Laizismus fortbestehen oder beseitigt werden soll. Stattdessen findet im Land ein politischer Machtkampf statt. Dabei geht es für die alten kemalistischen Eliten ums politische Überleben. Für die Vertreter der neuen bürgerlichen, religiös-konservativen Mittelschicht hingegen geht es um ihre Zukunft in einer globalisierten Welt.
Kaukasische Verwicklungen
(2008)
Seit den 1980er Jahren nehmen die neuen sozialen Bewegungen in Lateinamerika an Bedeutung rapide zu. Nachhaltige Transformationsprozesse auszulösen steht dabei seit den 1990er Jahren – in Zeiten neoliberaler Globalisierung und steigender Armut – im Zentrum gesellschaftlichen Handelns. Doch, angesichts der bestehenden globalen Strukturen, wie groß ist das Potenzial der neuen Welle sozialer Kräfte wirklich?
Geografie der Ungleichheit
(2008)
Irans zunehmender Einfluss als Regionalmacht wird wegen seines Atomprogramms und seiner antiwestlichen Politik als Störfaktor bewertet. Die offensive Rhetorik Teherans zielt primär darauf ab, möglichen Gefahren entgegenzutreten. Westliche Politik sollte das allseitig bestehende Interesse an regionaler Stabilität nutzen, um seine ausschließlich auf Eindämmung bedachte Politik zu überwinden.
Krise in Pakistan
(2008)
Im Gespräch werden folgende Themen behandelt: WT: Welche politische Bilanz der Präsidentschaft Putins würden Sie ziehen? WT: Wie haben sich die soziale und wirtschafliche Lage sowie das geistige Klima in Russland während dieser Zeit verändert? WT: Wie beurteilen Sie die Persönlichkeit und das politische Konzept des neuen Präsidenten Dimitri Medwedjew? WT: Wie schätzen Sie die sich ankündigende „Tandem“-Variante der Machtausübung im künftigen Russland ein? Wird es einen starken Ministerpräsidenten Putin und einen zu diesem loyalen, sich gewissermaßen selbstbeschränkenden Präsidenten Medwedjew geben? Oder widerspricht das dem Charakter des Institutionensystems in Russland?
Die Putin-Medwedjew-Rochade
(2008)
Die Globalisierung Russlands wird durch Rohstoffexporte und hohe Investitionen des Westens in den russischen Energiesektor vorangetrieben. Gleichzeitig festigt sich ein hybrides politisches System mit sowohl autoritären als auch demokratischen Elementen. Soll Russland ein zuverlässlicher Partner des Westens bleiben, müssen die russischen Interessen sowie die neue außenpolitische Stärke berücksichtigt werden.
Mit dem Vertrag von Lissabon verbinden sich hohe Erwartungen hinsichtlich der Effektivität zukünftiger Regelungen zum auswärtigen Handeln der Union. In der Gestaltung dieser Bestimmungen unterliegen die Mitgliedstaaten konstitutionellen Dilemmata, die eine Lösung erschweren. Obwohl im Detail durchaus Verbesserungen erkennbar sind, werden insgesamt zunehmende Konflikte und mangelnde Kohärenz erwartet.
Auszug: Aphasien sind variable Sprachstörungen, die auf umschriebene Hirnläsionen zurückführbar sind und die Produktion und Verständnis separat oder kombiniert betreffen (Weniger 2003). Hierbei wird das klinische Syndrom oft mit der Lokalisation der morphologischen Gehirndefekte (z. B. durch Hirn-infarkte oder -blutungen oder Tumoren) korreliert. Sprachkompetenz gilt in erster Linie als eine Leistung des Kortex, jedoch wurden v. a. im Zuge sich verbessernder bildgebender Verfahren aphasische Syndrome auch nach Läsionen subkortikaler Hirnregionen, insbesondere der Basalganglien und des Thalamus nachgewiesen (Wallesch & Papagno 1988; Friston et al. 1993; Nadeau & Crosson 1997; Zoppelt & Daum 2003; DeWitte et al. 2006; Wahl in Druck). Diese Strukturen liegen in der Tiefe des Gehirns und kommunizieren über weit gefächerte Faserverbindungen mit dem Kortex. In erster Linie werden den Basalganglien senso-motorische Kontrollfunktionen zugewiesen (Alexander et al. 1986). Diverse Erkrankungen, die durch Störungen physiologischer Bewegungsabläufe gekennzeichnet sind (z. B. Morbus Parkinson, Chorea Huntington), werden auf Funktionsdefekte dieser Strukturen zurückgeführt. Hierbei wurde der Thalamus häufig als Relais-Station des Informationsaustauschs zwischen anatomisch entfernten Arealen des Nervensystems aufgefasst. Basalganglien und Thalamus jedoch können darüber hinausgehende Funktionen, z. B. zur Bereitstellung, Aufrechterhaltung und Auslenkung von Aufmerksamkeit bei der Bearbeitung kognitiver Aufgaben, zugesprochen werden (Cavedini et al. 2006; Piguet et al. 2006; Klostermann et al. 2006; Marzinzik et al. 2008). [...]
Auszug: Wie arbeitet unser Gehirn? Was sind die Grundlagen der Kognition? Wie funktioniert unser Sprachsystem? Das ist nur ein kleiner Teil der Probleme, mit denen sich Kognitionsforscher und Neurowissenschaftler auf der ganzen Welt auseinandersetzen. Die Frage nach den neurofunktionellen Grundlagen der Sprachverarbeitung hat dabei zunehmend an Bedeutung gewonnen. Obwohl jedes gesunde Kind problemlos und auch unter schwierigen Bedingungen Sprache erwerben und verwenden kann, sind die zugrunde liegenden kognitiven und neurofunktionellen Mechanismen hierfür noch weitgehend ungeklärt. Immer häufiger werden neurolinguistische Fragestellungen mit funktionell-bildgebenden und anderen modernen Verfahren der Hirnforschung untersucht. Ein wesentliches Ziel dieser Forschungsbemühungen ist es, herauszufinden, wie Bedeutungen und Wörter in unserem Gehirn gespeichert sind. Ein besonderes Interesse wird gegenwärtig dem Problem der neuronalen Verarbeitung von Nomen und Verben entgegengebracht. Aktuelle Fragestellungen sind dabei, welche neuroanatomischen Korrelate der Verarbeitung von Nomen und Verben unterliegen und ob es Faktoren gibt, die die Verarbeitung beeinflussen. Zur Beantwortung dieser und weiterer Fragestellungen wurden im Rahmen meines Forschungsprojektes1 funktionelle Magnetresonanzdaten zum Benennen von Nomen und Verben bereitgestellt. Die wichtigsten Methoden und Ergebnisse sollen im Folgenden kurz dargelegt werden. [...]
Auszug: Bei der Beschreibung und Analyse von zentralen Störungen des Nachsprechens stehen - wie bei der Beschreibung und Analyse von Sprachproduktionsstörungen allgemein - Abweichungen auf der lautlichen Ebene zumeist im Vordergrund. In der schwersten Form solcher Störungen können dabei nur noch phonematische Neologismen produziert werden. Doch auch die Definition phonematischer Neologismen als „Wörter, die in der Standardsprache aus lautlichen Gründen … nicht vorkommen“ (Huber et al. 1983) bzw. „Lautkette, … die als solche kein Wort der betreffenden Sprache ist“ (Tesak 2006) beschränkt sich auf segmentale Abweichungen. Prosodische Abweichungen hingegen - insbesondere Abweichungen bei der Wortbetonung - sowie mögliche Wechselwirkungen zwischen segmentalen und prosodischen Eigenschaften von Stimulus und Reaktion werden kaum diskutiert. [...]
Auszug: Etwa zwei Drittel aller Ausgaben der Krankenkassen für das Heilmittel Sprachtherapie betreffen ein Klientel in der Altersgruppe der 0- bis 15-jährigen (GVK-HIS Bundesrepublik 2007). Spracherwerbsstörungen stellen das häufigste Entwicklungsrisiko bei Kindern dar. Ca. 18% der einzuschulenden Kinder weisen einen Förderbedarf im Entwicklungsbereich Sprache auf (Tollkühn 2001) und ca. 18% der 6-jährigen Jungen erhalten nach dem Heilmittelbericht 2006 Sprachtherapieverordnungen (Schröder & Waltersbacher 2006). Die überwiegende Mehrheit erhält diese Verordnung aufgrund der Zuweisung des Indikationsschlüssels „Störungen der Sprache vor Abschluss der Sprachentwicklung“. Darunter fallen v.a. Kinder mit einer primären Spracherwerbsstörung, für deren Art und Ausmaß keine Hörstörung, keine Intelligenzbeeinträchtigung, keine neurologische Schädigung oder soziale Deprivation verantwortlich gemacht werden kann. Für diese besondere Entwicklungssituation wird die Diagnose „Spezifische Spracherwerbsstörung (SSES)“ vergeben (Grimm 2003; Dannenbauer 2002). [...]
Auszug: Seit langem ist bekannt, dass Kinder mit Sprachentwicklungsstörungen meist schon in einem frühen Stadium ihrer Sprachentwicklung auffallen: die ersten Wörter werden verspätet produziert, der Wortschatz wächst langsamer an, der Vokabularspurt setzt verzögert ein oder bleibt aus, so dass das produktive Vokabular mit zwei Jahren weniger als 50 Wörter umfasst. Außerdem treten keine Wortkombinationen auf. Obwohl bei nahezu jeder Sprachentwicklungs-störung retrospektiv derartige frühe Anzeichen auszumachen sind, mündet andererseits nicht jede frühe Verzögerung in eine anhaltende Störung. Diese Beobachtung hat Anlass zu einer regen Forschungstätigkeit gegeben. Im Zentrum steht die Frage, anhand welcher Kriterien sich der weitere Entwicklungsverlauf eines sprachlich verzögerten Kindes prognostizieren lässt. Der Forschungsstand zu diesem Bereich wurde an anderer Stelle bereits ausführlich beschrieben (z. B. in Kauschke 2000, 2003, 2006a). In diesem Beitrag möchte ich die Entwicklungswege dieser Population anhand aktueller Studien skizzieren, die Problematik der Prädiktion ansprechen und eine Studie über Sprachentwicklungsverläufe im dritten Lebensjahr vorstellen, in der ungestörte Kinder und sprachlich verzögerte längsschnittlich beobachtet wurden. Es folgen Überlegungen zur Therapienotwendigkeit und Therapiekonzeption, die durch die Darstellung eines exemplarischen Therapieverlaufs bei einem Einzelfall illustriert werden. [...]
Auszug: Lange Zeit hat die Spracherwerbsforschung den Erwerb des syntaktischen Wissens in den Mittelpunkt gestellt, da Syntax als humanspezifisch angesehen und somit als der zentrale Bereich von Sprache verstanden wurde. Auch ein aktueller Aufsatz von Hauser, Chomsky & Fitch (2002) setzt die Sprachfähigkeit im engeren Sinne („language faculty narrow“) mit dem in der Syntax gegebenen Rekursionsmechanismus gleich. Syntax, so die Autoren weiter, konnte bislang noch keinem subhumanen Primaten beigebracht werden, wohingegen ein Erwerb von Wörtern bereits belegt wurde. So lernte beispielsweise der Bonobo Kanzi knapp 600 Begriffe (Savage-Rumbaughh & Lewin 1994). Lässt sich daraus ableiten, dass Wörter im Rahmen der menschlichen Sprachfähigkeit weniger wichtig sind als das syntaktische Wissen? Sind Wörter letztendlich nur „Zierrat“ an einem rein syntaktischen Sprachgebäude? [...]
Small livestock is an important resource for rural human populations in dry climates. How strongly will climate change affect the capacity of the rangeland? We used hierarchical modelling to scale quantitatively the growth of shrubs and annual plants, the main food of sheep and goats, to the landscape extent in the eastern Mediterranean region. Without grazing, productivity increased in a sigmoid way with mean annual precipitation. Grazing reduced productivity more strongly the drier the landscape. At a point just under the stocking capacity of the vegetation, productivity declined precipitously with more intense grazing due to a lack of seed production of annuals. We repeated simulations with precipitation patterns projected by two contrasting IPCC scenarios. Compared to results based on historic patterns, productivity and stocking capacity did not differ in most cases. Thus, grazing intensity remains the stronger impact on landscape productivity in this dry region even in the future.
A multitype Dawson-Watanabe process is conditioned, in subcritical and critical cases, on non-extinction in the remote future. On every finite time interval, its distribution is absolutely continuous with respect to the law of the unconditioned process. A martingale problem characterization is also given. Several results on the long time behavior of the conditioned mass process - the conditioned multitype Feller branching diffusion - are then proved. The general case is first considered, where the mutation matrix which models the interaction between the types, is irreducible. Several two-type models with decomposable mutation matrices are analyzed too .
The effect of moderate rates of nitrogen deposition on ground floor vegetation is poorly predicted by uncontrolled surveys or fertilization experiments using high rates of nitrogen (N) addition. We compared the temporal trends of ground floor vegetation in permanent plots with moderate (7–13 kg ha−1 year−1) and lower bulk N deposition (4–6 kg ha−1 year−1) in southern Sweden during 1982–1998. We examined whether trends differed between growth forms (vascular plants and bryophytes) and vegetation types (three types of coniferous forest, deciduous forest, and bog). Trends of site-standardized cover and richness varied among growth forms, vegetation types, and deposition regions. Cover in spruce forests decreased at the same rate with both moderate and low deposition. In pine forests cover decreased faster with moderate deposition and in bogs cover decreased faster with low deposition. Cover of bryophytes in spruce forests increased at the same rate with both moderate and low deposition. In pine forests cover decreased faster with moderate deposition and in bogs and deciduous forests there was a strong non-linear increase with moderate deposition. The trend of number of vascular plants was constant with moderate and decreased with low deposition. We found no trend in the number of bryophyte species. We propose that the decrease of cover and number with low deposition was related to normal ecosystem development (increased shading), suggesting that N deposition maintained or increased the competitiveness of some species in the moderate-deposition region. Deposition had no consistent negative effect on vegetation suggesting that it is less important than normal successional processes.