TY - THES A1 - Malchow, Anne-Kathleen T1 - Developing an integrated platform for predicting niche and range dynamics BT - inverse calibration of spatially-explicit eco-evolutionary models N2 - Species are adapted to the environment they live in. Today, most environments are subjected to rapid global changes induced by human activity, most prominently land cover and climate changes. Such transformations can cause adjustments or disruptions in various eco-evolutionary processes. The repercussions of this can appear at the population level as shifted ranges and altered abundance patterns. This is where global change effects on species are usually detected first. To understand how eco-evolutionary processes act and interact to generate patterns of range and abundance and how these processes themselves are influenced by environmental conditions, spatially-explicit models provide effective tools. They estimate a species’ niche as the set of environmental conditions in which it can persist. However, the currently most commonly used models rely on static correlative associations that are established between a set of spatial predictors and observed species distributions. For this, they assume stationary conditions and are therefore unsuitable in contexts of global change. Better equipped are process-based models that explicitly implement algorithmic representations of eco-evolutionary mechanisms and evaluate their joint dynamics. These models have long been regarded as difficult to parameterise, but an increased data availability and improved methods for data integration lessen this challenge. Hence, the goal of this thesis is to further develop process-based models, integrate them into a complete modelling workflow, and provide the tools and guidance for their successful application. With my thesis, I presented an integrated platform for spatially-explicit eco-evolutionary modelling and provided a workflow for their inverse calibration to observational data. In the first chapter, I introduced RangeShiftR, a software tool that implements an individual-based modelling platform for the statistical programming language R. Its open-source licensing, extensive help pages and available tutorials make it accessible to a wide audience. In the second chapter, I demonstrated a comprehensive workflow for the specification, calibration and validation of RangeShiftR by the example of the red kite in Switzerland. The integration of heterogeneous data sources, such as literature and monitoring data, allowed to successfully calibrate the model. It was then used to make validated, spatio-temporal predictions of future red kite abundance. The presented workflow can be adopted to any study species if data is available. In the third chapter, I extended RangeShiftR to directly link demographic processes to climatic predictors. This allowed me to explore the climate-change responses of eight Swiss breeding birds in more detail. Specifically, the model could identify the most influential climatic predictors, delineate areas of projected demographic suitability, and attribute current population trends to contemporary climate change. My work shows that the application of complex, process-based models in conservation-relevant contexts is feasible, utilising available tools and data. Such models can be successfully calibrated and outperform other currently used modelling approaches in terms of predictive accuracy. Their projections can be used to predict future abundances or to assess alternative conservation scenarios. They further improve our mechanistic understanding of niche and range dynamics under climate change. However, only fully mechanistic models, that include all relevant processes, allow to precisely disentangle the effects of single processes on observed abundances. In this respect, the RangeShiftR model still has potential for further extensions that implement missing influential processes, such as species interactions. Dynamic, process-based models are needed to adequately model a dynamic reality. My work contributes towards the advancement, integration and dissemination of such models. This will facilitate numeric, model-based approaches for species assessments, generate ecological insights and strengthen the reliability of predictions on large spatial scales under changing conditions. N2 - Arten sind an ihren jeweiligen Lebensraum angepasst, doch viele Lebensräume sind heute einem globalen Wandel unterworfen. Dieser äußert sich vor allem in Veränderungen von Landnutzung und Klima, welche durch menschliche Aktivitäten verursacht werden und ganze Ökosysteme in ihrem Gefüge stören können. Störungen der grundlegenden öko-evolutionären Prozesse können auf der Populationsebene in Form von veränderten Verbreitungsgebieten und Häufigkeitsmustern sichtbar werden. Hier werden die Auswirkungen des globalen Wandels auf eine Art oftmals zuerst beobachtet. Um zu untersuchen, wie die Wirkung und Wechselwirkung der verschiedenen öko-evolutionären Prozesse die beobachteten Verbreitungs- und Häufigkeitsmuster erzeugen, und wie diese Prozesse wiederum von Umweltbedingungen beeinflusst werden, stellen räumlich explizite Modelle wirksame Instrumente dar. Sie beschreiben die ökologische Nische einer Art, also die Gesamtheit aller Umweltbedingungen, unter denen die Art fortbestehen kann. Die derzeit am häufigsten verwendeten Modelle stützen sich auf statische, korrelative Zusammenhänge, die zwischen bestimmten räumlichen Prädiktoren und den beobachteten Artverteilungen hergestellt werden. Allerdings werden dabei stationäre Bedingungen angenommen, was sie im Kontext des globalen Wandels ungeeignet macht. Deutlich besser geeignet sind prozessbasierte Modelle, welche explizite, algorithmische Repräsentationen von ökologischen Prozessen beinhalten und deren gemeinsame Dynamik berechnen. Solche Modelle galten lange Zeit als schwierig zu parametrisieren, doch die zunehmende Verfügbarkeit von Beobachtungsdaten sowie die verbesserten Methoden zur Datenintegration machen ihre Verwendung zunehmend praktikabel. Das Ziel der vorliegenden Arbeit ist es, diese prozessbasierten Modelle weiterzuentwickeln, sie in umfassende Modellierungsabläufe einzubinden, sowie Software und Anleitungen für ihre erfolgreiche Anwendung verfügbar zu machen. In meiner Dissertation präsentiere ich eine integrierte Plattform für räumlich-explizite, öko-evolutionäre Modellierung und entwickle einen Arbeitsablauf für dessen inverse Kalibrierung an Beobachtungsdaten. Im ersten Kapitel stelle ich RangeShiftR vor: eine Software, die eine individuenbasierte Modellierungsplattform für die statistische Programmiersprache R implementiert. Durch die Open-Source-Lizenzierung, umfangreichen Hilfeseiten und online verfügbaren Tutorials ist RangeShiftR einem breiten Publikum zugänglich. Im zweiten Kapitel demonstriere ich einen vollständigen Modellierungsablauf am Beispiel des Rotmilans in der Schweiz, der die Spezifikation, Kalibrierung und Validierung von RangeShiftR umfasst.Durch die Integration heterogener Datenquellen, wie Literatur- und Monitoringdaten, konnte das Modell erfolgreich kalibriert werden. Damit konnten anschließend validierte, raum-zeitliche Vorhersagen über das Vorkommen des Rotmilans erstellt und die dafür relevanten Prozesse identifiziert werden. Der vorgestellte Arbeitsablauf kann auf andere Arten übertragen werden, sofern geeignete Daten verfügbar sind. Im dritten Kapitel habe ich RangeShiftR erweitert, sodass demografische Prozessraten direkt mit Klimavariablen verknüpft werden können. Dies ermöglichte es, die Reaktionen von acht Schweizer Brutvogelarten auf den Klimawandel genauer zu untersuchen. Insbesondere konnte das Modell die einflussreichsten klimatischen Faktoren identifizieren, demografisch geeignete Gebiete abgrenzen und aktuelle Populationstrends auf den bisherigen Klimawandel zurückführen. Meine Arbeit zeigt, dass die Anwendung komplexer, prozessbasierter Modelle in naturschutzrelevanten Kontexten mit verfügbaren Daten möglich ist. Solche Modelle können erfolgreich kalibriert werden und andere, derzeit verwendete Modellierungsansätze in Bezug auf ihre Vorhersagegenauigkeit übertreffen. Ihre Projektionen können zur Vorhersage zukünftiger Artvorkommen und zur Einschätzung alternativer Naturschutzmaßnahmen verwendet werden. Sie verbessern außerdem unser mechanistisches Verständnis von Nischen- und Verbreitungsdynamiken unter dem Einfluss des Klimawandels. Jedoch ermöglichen nur vollständig prozessbasierte Modelle, die alle relevanten Prozesse vereinen, eine korrekte Aufschlüsselung der Auswirkungen einzelner Prozesse auf die beobachteten Abundanzen. In dieser Hinsicht hat das RangeShiftR-Modell noch Potenzial für Weiterentwicklungen, um fehlende, einflussreiche Prozesse hinzuzufügen, wie zum Beispiel die Interaktionen zwischen Arten. Um eine dynamische Realität adäquat abbilden zu können, werden dynamische, prozessbasierte Modelle benötigt. Meine Arbeit leistet einen Beitrag zur Weiterentwicklung, Integration und Verbreitung solcher Modelle und stärkt somit die Anwendung numerischer, modellbasierter Methoden für die Bewertung des Zustands von Arten, die Untersuchung ökologischer Zusammenhänge und die Steigerung der Zuverlässigkeit von Vorhersagen auf großen räumlichen Skalen unter Umweltveränderungen. T2 - Entwicklung einer integrierten Modellierungs-Plattform zur Vorhersage von Nischen- und Verbreitungs-dynamiken: Inverse Kalibrierung räumlich-expliziter öko-evolutionärer Modelle KW - species distribution modelling KW - Bayesian inference KW - individual-based modelling KW - range shifts KW - ecological modelling KW - population dynamics KW - Bayes'sche Inferenz KW - ökologische Modellierung KW - individuen-basierte Modellierung KW - Populationsdynamik KW - Arealverschiebungen KW - Artverbreitungsmodelle Y1 - 2023 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-602737 ER - TY - THES A1 - Malem-Shinitski, Noa T1 - Bayesian inference and modeling for point processes with applications from neuronal activity to scene viewing T1 - Bayessche Inferenz und Modellierung für Punktprozesse mit Anwendungen von neuronaler Aktivität bis Szenenbetrachtung N2 - Point processes are a common methodology to model sets of events. From earthquakes to social media posts, from the arrival times of neuronal spikes to the timing of crimes, from stock prices to disease spreading -- these phenomena can be reduced to the occurrences of events concentrated in points. Often, these events happen one after the other defining a time--series. Models of point processes can be used to deepen our understanding of such events and for classification and prediction. Such models include an underlying random process that generates the events. This work uses Bayesian methodology to infer the underlying generative process from observed data. Our contribution is twofold -- we develop new models and new inference methods for these processes. We propose a model that extends the family of point processes where the occurrence of an event depends on the previous events. This family is known as Hawkes processes. Whereas in most existing models of such processes, past events are assumed to have only an excitatory effect on future events, we focus on the newly developed nonlinear Hawkes process, where past events could have excitatory and inhibitory effects. After defining the model, we present its inference method and apply it to data from different fields, among others, to neuronal activity. The second model described in the thesis concerns a specific instance of point processes --- the decision process underlying human gaze control. This process results in a series of fixated locations in an image. We developed a new model to describe this process, motivated by the known Exploration--Exploitation dilemma. Alongside the model, we present a Bayesian inference algorithm to infer the model parameters. Remaining in the realm of human scene viewing, we identify the lack of best practices for Bayesian inference in this field. We survey four popular algorithms and compare their performances for parameter inference in two scan path models. The novel models and inference algorithms presented in this dissertation enrich the understanding of point process data and allow us to uncover meaningful insights. N2 - Punktprozesse sind eine gängige Methode zur Modellierung von Ereignismengen. Von Erdbeben bis zu Social-Media-Posts, von den neuronalen Spikes bis zum Zeitpunkt von Verbrechen, von Aktienkursen bis zur Ausbreitung von Krankheiten - diese Phänomene lassen sich auf das Auftreten von Ereignissen reduzieren, die in Punkten konzentriert sind. Häufig treten diese Ereignisse nacheinander auf und bilden eine Zeitreihe. Modelle von Punktprozessen können verwendet werden, um unser Verständnis solcher Ereignisse für Klassifizierung und Vorhersage zu vertiefen. Solche Modelle umfassen einen zugrunde liegenden Zufallsprozess, der die Ereignisse erzeugt. In dieser Arbeit wird die Bayes'sche Methodik verwendet, um den zugrunde liegenden generativen Prozess aus den beobachteten Daten abzuleiten. Wir leisten einen doppelten Beitrag: Wir entwickeln neue Modelle und neue Inferenzmethoden für diese Prozesse. Wir schlagen ein Modell vor, das die Familie der Punktprozesse erweitert, bei denen das Auftreten eines Ereignisses von den vorherigen Ereignissen abhängt. Diese Familie ist als Hawkes-Prozesse bekannt. Während in den meisten bestehenden Modellen solcher Prozesse davon ausgegangen wird, dass vergangene Ereignisse nur eine exzitatorische Wirkung auf zukünftige Ereignisse haben, konzentrieren wir uns auf den neu entwickelten nichtlinearen Hawkes-Prozess, bei dem vergangene Ereignisse exzitatorische und hemmende Wirkungen haben können. Nach der Definition des Modells stellen wir seine Inferenzmethode vor und wenden sie auf Daten aus verschiedenen Bereichen an, unter anderem auf die neuronale Aktivität. Das zweite Modell, das in dieser Arbeit beschrieben wird, betrifft einen speziellen Fall von Punktprozessen - den Entscheidungsprozess, der der menschlichen Blicksteuerung zugrunde liegt. Dieser Prozess führt zu einer Reihe von fixierten Positionen in einem Bild. Wir haben ein neues Modell entwickelt, um diesen Prozess zu beschreiben, motiviert durch das bekannte Exploration-Exploitation-Dilemma. Neben dem Modell stellen wir einen Bayes'schen Inferenzalgorithmus vor, um die Modellparameter abzuleiten. Wir bleiben auf dem Gebiet der menschlichen Szenenbetrachtung und stellen fest, dass es in diesem Bereich keine bewährten Verfahren für die Bayes'sche Inferenz gibt. Wir geben einen Überblick über vier gängige Algorithmen und vergleichen ihre Leistungen bei der Ableitung von Parametern für zwei Scanpfadmodelle. Die in dieser Dissertation vorgestellten neuen Modelle und Inferenzalgorithmen bereichern das Verständnis von Punktprozessdaten und ermöglichen es uns, sinnvolle Erkenntnisse zu gewinnen. KW - Bayesian inference KW - point process KW - statistical machine learning KW - sampling KW - modeling KW - Bayessche Inferenz KW - Modellierung KW - Punktprozess KW - Stichprobenentnahme aus einem statistischen Modell KW - statistisches maschinelles Lernen Y1 - 2023 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-614952 ER - TY - THES A1 - Thapa, Samudrajit T1 - Deciphering anomalous diffusion in complex systems using Bayesian inference and large deviation theory N2 - The development of methods such as super-resolution microscopy (Nobel prize in Chemistry, 2014) and multi-scale computer modelling (Nobel prize in Chemistry, 2013) have provided scientists with powerful tools to study microscopic systems. Sub-micron particles or even fluorescently labelled single molecules can now be tracked for long times in a variety of systems such as living cells, biological membranes, colloidal solutions etc. at spatial and temporal resolutions previously inaccessible. Parallel to such single-particle tracking experiments, super-computing techniques enable simulations of large atomistic or coarse-grained systems such as biologically relevant membranes or proteins from picoseconds to seconds, generating large volume of data. These have led to an unprecedented rise in the number of reported cases of anomalous diffusion wherein the characteristic features of Brownian motion—namely linear growth of the mean squared displacement with time and the Gaussian form of the probability density function (PDF) to find a particle at a given position at some fixed time—are routinely violated. This presents a big challenge in identifying the underlying stochastic process and also estimating the corresponding parameters of the process to completely describe the observed behaviour. Finding the correct physical mechanism which leads to the observed dynamics is of paramount importance, for example, to understand the first-arrival time of transcription factors which govern gene regulation, or the survival probability of a pathogen in a biological cell post drug administration. Statistical Physics provides useful methods that can be applied to extract such vital information. This cumulative dissertation, based on five publications, focuses on the development, implementation and application of such tools with special emphasis on Bayesian inference and large deviation theory. Together with the implementation of Bayesian model comparison and parameter estimation methods for models of diffusion, complementary tools are developed based on different observables and large deviation theory to classify stochastic processes and gather pivotal information. Bayesian analysis of the data of micron-sized particles traced in mucin hydrogels at different pH conditions unveiled several interesting features and we gained insights into, for example, how in going from basic to acidic pH, the hydrogel becomes more heterogeneous and phase separation can set in, leading to observed non-ergodicity (non-equivalence of time and ensemble averages) and non-Gaussian PDF. With large deviation theory based analysis we could detect, for instance, non-Gaussianity in seeming Brownian diffusion of beads in aqueous solution, anisotropic motion of the beads in mucin at neutral pH conditions, and short-time correlations in climate data. Thus through the application of the developed methods to biological and meteorological datasets crucial information is garnered about the underlying stochastic processes and significant insights are obtained in understanding the physical nature of these systems. N2 - Die Entwicklung von Methoden wie der superauflösenden Mikroskopie (Nobelpreis für Chemie, 2014) und der Multiskalen-Computermodellierung (Nobelpreis für Chemie, 2013) hat Wis- senschaftlern mächtige Werkzeuge zur Untersuchung mikroskopischer Systeme zur Verfügung gestellt. Submikrometer Partikel und sogar einzelne fluoreszent markierte Moleküle können heute über lange Beobachtungszeiten in einer Vielzahl von Systemen, wie z.B. lebenden Zellen, biologischen Membranen und kolloidalen Suspensionen, mit bisher unerreichter räumlicher und zeitlicher Auflösung verfolgt werden. Neben solchen Einzelpartikelverfolgungsexperi- menten ermöglichen Supercomputer die Simulation großer atomistischer oder coarse-grained Systeme, wie z..B. biologisch relevante Membranen oder Proteine, über wenige Picosekunden bis hin zu einigen Sekunden, wobei große Datenmengen produziert werden. Diese haben zu einem beispiellosen Anstieg in der Zahl berichteter Fälle von anomaler Diffusion geführt, bei welcher die charakteristischen Eigenschaften der Brownschen Diffusion—nämlich das lineare Wachstum der mittleren quadratischen Verschiebung mit der Zeit und die Gaußsche Form der Wahrscheinlichkeitsdichtefunktion ein Partikel an einem gegebenen Ort und zu gegebener Zeit zu finden—verletzt sind. Dies stellt eine große Herausforderung bei der Identifizierung des zugrundeliegenden stochastischen Prozesses und der Schätzung der zugehörigen Prozess- parameter dar, was zur vollständigen Beschreibung des beobachteten Verhaltens nötig ist. Das Auffinden des korrekten physikalischen Mechanismus, welcher zum beobachteten Verhal- ten führt, ist von überragender Bedeutung, z.B. beim Verständnis der, die Genregulation steuernden, first-arrival time von Transkriptionsfaktoren oder der Überlebensfunktion eines Pathogens in einer biologischen Zelle nach Medikamentengabe. Die statistische Physik stellt nützliche Methoden bereit, die angewendet werden können, um solch wichtige Informationen zu erhalten. Der Schwerpunkt der vorliegenden, auf fünf Publikationen basierenden, kumulativen Dissertation liegt auf der Entwicklung, Implementierung und Anwendung solcher Methoden, mit einem besonderen Schwerpunkt auf der Bayesschen Inferenz und der Theorie der großen Abweichungen. Zusammen mit der Implementierung eines Bayesschen Modellvergleichs und Methoden zur Parameterschätzung für Diffusionsmodelle werden ergänzende Methoden en- twickelt, welche auf unterschiedliche Observablen und der Theorie der großen Abweichungen basieren, um stochastische Prozesse zu klassifizieren und wichtige Informationen zu erhalten. Die Bayessche Analyse der Bewegungsdaten von Mikrometerpartikeln, welche in Mucin- hydrogelen mit verschiedenen pH-Werten verfolgt wurden, enthüllte mehrere interessante Eigenschaften und wir haben z.B. Einsichten darüber gewonnen, wie der Übergang von basischen zu sauren pH-Werten die Heterogenität des Hydrogels erhöht und Phasentrennung einsetzen kann, was zur beobachteten Nicht-Ergodizität (Inäquivalenz von Zeit- und En- semblemittelwert) und nicht-Gaußscher Wahrscheinlichkeitsdichte führt. Mit einer auf der Theorie der großen Abweichungen basierenden Analyse konnten wir, z.B., nicht-Gaußsches Verhalten bei der scheinbaren Brownschen Diffusion von Partikeln in wässriger Lösung, anisotrope Bewegung von Partikeln in Mucin bei neutralem pH-Wert und Kurzzeitkorrela- tionen in Klimadaten detektieren. Folglich werden durch die Anwendung der entwickelten Methoden auf biologische und meteorologische Daten entscheidende Informationen über die zugrundeliegenden stochastischen Prozesse gesammelt und bedeutende Erkenntnisse für das Verständnis der Eigenschaften dieser Systeme erhalten. KW - anomalous diffusion KW - Bayesian inference KW - large deviation theory KW - statistical physics Y1 - 2020 ER - TY - THES A1 - Makarava, Natallia T1 - Bayesian estimation of self-similarity exponent T1 - Bayessche Schätzung des selbstählichen Exponenten N2 - Estimation of the self-similarity exponent has attracted growing interest in recent decades and became a research subject in various fields and disciplines. Real-world data exhibiting self-similar behavior and/or parametrized by self-similarity exponent (in particular Hurst exponent) have been collected in different fields ranging from finance and human sciencies to hydrologic and traffic networks. Such rich classes of possible applications obligates researchers to investigate qualitatively new methods for estimation of the self-similarity exponent as well as identification of long-range dependencies (or long memory). In this thesis I present the Bayesian estimation of the Hurst exponent. In contrast to previous methods, the Bayesian approach allows the possibility to calculate the point estimator and confidence intervals at the same time, bringing significant advantages in data-analysis as discussed in this thesis. Moreover, it is also applicable to short data and unevenly sampled data, thus broadening the range of systems where the estimation of the Hurst exponent is possible. Taking into account that one of the substantial classes of great interest in modeling is the class of Gaussian self-similar processes, this thesis considers the realizations of the processes of fractional Brownian motion and fractional Gaussian noise. Additionally, applications to real-world data, such as the data of water level of the Nile River and fixational eye movements are also discussed. N2 - Die Abschätzung des Selbstähnlichkeitsexponenten hat in den letzten Jahr-zehnten an Aufmerksamkeit gewonnen und ist in vielen wissenschaftlichen Gebieten und Disziplinen zu einem intensiven Forschungsthema geworden. Reelle Daten, die selbsähnliches Verhalten zeigen und/oder durch den Selbstähnlichkeitsexponenten (insbesondere durch den Hurst-Exponenten) parametrisiert werden, wurden in verschiedenen Gebieten gesammelt, die von Finanzwissenschaften über Humanwissenschaften bis zu Netzwerken in der Hydrologie und dem Verkehr reichen. Diese reiche Anzahl an möglichen Anwendungen verlangt von Forschern, neue Methoden zu entwickeln, um den Selbstähnlichkeitsexponenten abzuschätzen, sowie großskalige Abhängigkeiten zu erkennen. In dieser Arbeit stelle ich die Bayessche Schätzung des Hurst-Exponenten vor. Im Unterschied zu früheren Methoden, erlaubt die Bayessche Herangehensweise die Berechnung von Punktschätzungen zusammen mit Konfidenzintervallen, was von bedeutendem Vorteil in der Datenanalyse ist, wie in der Arbeit diskutiert wird. Zudem ist diese Methode anwendbar auf kurze und unregelmäßig verteilte Datensätze, wodurch die Auswahl der möglichen Anwendung, wo der Hurst-Exponent geschätzt werden soll, stark erweitert wird. Unter Berücksichtigung der Tatsache, dass der Gauß'sche selbstähnliche Prozess von bedeutender Interesse in der Modellierung ist, werden in dieser Arbeit Realisierungen der Prozesse der fraktionalen Brown'schen Bewegung und des fraktionalen Gauß'schen Rauschens untersucht. Zusätzlich werden Anwendungen auf reelle Daten, wie Wasserstände des Nil und fixierte Augenbewegungen, diskutiert. KW - Hurst-Exponent KW - Bayessche Statistik KW - fraktionale Brown'schen Bewegung KW - fraktionales Gauß'sches Rauschen KW - fixierte Augenbewegungen KW - Hurst exponent KW - Bayesian inference KW - fractional Brownian motion KW - fractional Gaussian noise KW - fixational eye movements Y1 - 2012 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus-64099 ER -