TY - THES A1 - Malem-Shinitski, Noa T1 - Bayesian inference and modeling for point processes with applications from neuronal activity to scene viewing T1 - Bayessche Inferenz und Modellierung für Punktprozesse mit Anwendungen von neuronaler Aktivität bis Szenenbetrachtung N2 - Point processes are a common methodology to model sets of events. From earthquakes to social media posts, from the arrival times of neuronal spikes to the timing of crimes, from stock prices to disease spreading -- these phenomena can be reduced to the occurrences of events concentrated in points. Often, these events happen one after the other defining a time--series. Models of point processes can be used to deepen our understanding of such events and for classification and prediction. Such models include an underlying random process that generates the events. This work uses Bayesian methodology to infer the underlying generative process from observed data. Our contribution is twofold -- we develop new models and new inference methods for these processes. We propose a model that extends the family of point processes where the occurrence of an event depends on the previous events. This family is known as Hawkes processes. Whereas in most existing models of such processes, past events are assumed to have only an excitatory effect on future events, we focus on the newly developed nonlinear Hawkes process, where past events could have excitatory and inhibitory effects. After defining the model, we present its inference method and apply it to data from different fields, among others, to neuronal activity. The second model described in the thesis concerns a specific instance of point processes --- the decision process underlying human gaze control. This process results in a series of fixated locations in an image. We developed a new model to describe this process, motivated by the known Exploration--Exploitation dilemma. Alongside the model, we present a Bayesian inference algorithm to infer the model parameters. Remaining in the realm of human scene viewing, we identify the lack of best practices for Bayesian inference in this field. We survey four popular algorithms and compare their performances for parameter inference in two scan path models. The novel models and inference algorithms presented in this dissertation enrich the understanding of point process data and allow us to uncover meaningful insights. N2 - Punktprozesse sind eine gängige Methode zur Modellierung von Ereignismengen. Von Erdbeben bis zu Social-Media-Posts, von den neuronalen Spikes bis zum Zeitpunkt von Verbrechen, von Aktienkursen bis zur Ausbreitung von Krankheiten - diese Phänomene lassen sich auf das Auftreten von Ereignissen reduzieren, die in Punkten konzentriert sind. Häufig treten diese Ereignisse nacheinander auf und bilden eine Zeitreihe. Modelle von Punktprozessen können verwendet werden, um unser Verständnis solcher Ereignisse für Klassifizierung und Vorhersage zu vertiefen. Solche Modelle umfassen einen zugrunde liegenden Zufallsprozess, der die Ereignisse erzeugt. In dieser Arbeit wird die Bayes'sche Methodik verwendet, um den zugrunde liegenden generativen Prozess aus den beobachteten Daten abzuleiten. Wir leisten einen doppelten Beitrag: Wir entwickeln neue Modelle und neue Inferenzmethoden für diese Prozesse. Wir schlagen ein Modell vor, das die Familie der Punktprozesse erweitert, bei denen das Auftreten eines Ereignisses von den vorherigen Ereignissen abhängt. Diese Familie ist als Hawkes-Prozesse bekannt. Während in den meisten bestehenden Modellen solcher Prozesse davon ausgegangen wird, dass vergangene Ereignisse nur eine exzitatorische Wirkung auf zukünftige Ereignisse haben, konzentrieren wir uns auf den neu entwickelten nichtlinearen Hawkes-Prozess, bei dem vergangene Ereignisse exzitatorische und hemmende Wirkungen haben können. Nach der Definition des Modells stellen wir seine Inferenzmethode vor und wenden sie auf Daten aus verschiedenen Bereichen an, unter anderem auf die neuronale Aktivität. Das zweite Modell, das in dieser Arbeit beschrieben wird, betrifft einen speziellen Fall von Punktprozessen - den Entscheidungsprozess, der der menschlichen Blicksteuerung zugrunde liegt. Dieser Prozess führt zu einer Reihe von fixierten Positionen in einem Bild. Wir haben ein neues Modell entwickelt, um diesen Prozess zu beschreiben, motiviert durch das bekannte Exploration-Exploitation-Dilemma. Neben dem Modell stellen wir einen Bayes'schen Inferenzalgorithmus vor, um die Modellparameter abzuleiten. Wir bleiben auf dem Gebiet der menschlichen Szenenbetrachtung und stellen fest, dass es in diesem Bereich keine bewährten Verfahren für die Bayes'sche Inferenz gibt. Wir geben einen Überblick über vier gängige Algorithmen und vergleichen ihre Leistungen bei der Ableitung von Parametern für zwei Scanpfadmodelle. Die in dieser Dissertation vorgestellten neuen Modelle und Inferenzalgorithmen bereichern das Verständnis von Punktprozessdaten und ermöglichen es uns, sinnvolle Erkenntnisse zu gewinnen. KW - Bayesian inference KW - point process KW - statistical machine learning KW - sampling KW - modeling KW - Bayessche Inferenz KW - Modellierung KW - Punktprozess KW - Stichprobenentnahme aus einem statistischen Modell KW - statistisches maschinelles Lernen Y1 - 2023 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-614952 ER - TY - THES A1 - Hübner, Andrea T1 - Ein multityper Verzweigungsprozess als Modell zur Untersuchung der Ausbreitung von Covid-19 T1 - Modeling the spread of Covid-19 using a multitype branching process N2 - Im Zuge der Covid-19 Pandemie werden zwei Werte täglich diskutiert: Die zuletzt gemeldete Zahl der neu Infizierten und die sogenannte Reproduktionsrate. Sie gibt wieder, wie viele weitere Menschen ein an Corona erkranktes Individuum im Durchschnitt ansteckt. Für die Schätzung dieses Wertes gibt es viele Möglichkeiten - auch das Robert Koch-Institut gibt in seinem täglichen Situationsbericht stets zwei R-Werte an: Einen 4-Tage-R-Wert und einen weniger schwankenden 7-Tage-R-Wert. Diese Arbeit soll eine weitere Möglichkeit vorstellen, einige Aspekte der Pandemie zu modellieren und die Reproduktionsrate zu schätzen. In der ersten Hälfte der Arbeit werden die mathematischen Grundlagen vorgestellt, die man für die Modellierung benötigt. Hierbei wird davon ausgegangen, dass der Leser bereits ein Basisverständnis von stochastischen Prozessen hat. Im Abschnitt Grundlagen werden Verzweigungsprozesse mit einigen Beispielen eingeführt und die Ergebnisse aus diesem Themengebiet, die für diese Arbeit wichtig sind, präsentiert. Dabei gehen wir zuerst auf einfache Verzweigungsprozesse ein und erweitern diese dann auf Verzweigungsprozesse mit mehreren Typen. Um die Notation zu erleichtern, beschränken wir uns auf zwei Typen. Das Prinzip lässt sich aber auf eine beliebige Anzahl von Typen erweitern. Vor allem soll die Wichtigkeit des Parameters λ herausgestellt werden. Dieser Wert kann als durchschnittliche Zahl von Nachfahren eines Individuums interpretiert werden und bestimmt die Dynamik des Prozesses über einen längeren Zeitraum. In der Anwendung auf die Pandemie hat der Parameter λ die gleiche Rolle wie die Reproduktionsrate R. In der zweiten Hälfte dieser Arbeit stellen wir eine Anwendung der Theorie über Multitype Verzweigungsprozesse vor. Professor Yanev und seine Mitarbeiter modellieren in ihrer Veröffentlichung Branching stochastic processes as models of Covid-19 epidemic development die Ausbreitung des Corona Virus' über einen Verzweigungsprozess mit zwei Typen. Wir werden dieses Modell diskutieren und Schätzer daraus ableiten: Ziel ist es, die Reproduktionsrate zu ermitteln. Außerdem analysieren wir die Möglichkeiten, die Dunkelziffer (die Zahl nicht gemeldeter Krankheitsfälle) zu schätzen. Wir wenden die Schätzer auf die Zahlen von Deutschland an und werten diese schließlich aus. N2 - During the Covid-19 pandemic, the discussion about the situation has been dominated by two numbers: the number of daily new infected individuals and the reproduction rate. The latter is the average number of people, one infected individual will infect with the disease. Because the number of registered infected individuals is generally not equal to the actual number of people who carry the Corona virus, many facts about the pandemic have to be estimated and can not be known for certain. Since the reproduction rate is an important parameter to signify the course of the Pandemic, many ways to estimate it have been developed. The Institute of Robert Koch in Germany uses two reproduction rates R in their daily reports: The 4-days-R-value and the less fluctuating 7-days-Rvalue. This master thesis will develop another model to estimate the R-value and other interesting aspects of the pandemic. The first part of this thesis is dedicated to the mathematical foundations needed to understand the model. The reader is expected to already have basic understanding of stochastic processes. In the section Grundlagen we will discuss branching processes and present the results of their theory that are important for our work. We start by introducing simple branching processes and expand the results to multitype branching processes. In service of a simpler notation we will only consider twotype branching processes, but the results can be used for any number of types. The importance of the parameter λ shall be stressed. It can be seen as the average number of descendants of one individual and dictates the dynamic of the process over a long period of time. Applied to the modeling of the pandemic, λ plays the same role as the reproduction rate R. In the second part of this thesis will present an application of the previously developed theory about multitype branching processes. Prof. Yanev and his colleagues modeled in their publication Branching stochastic processes as models of Covid-19 epidemic development the spreading of the Corona virus by using a branching process with two types. We will discuss this model and deduce estimators from it. We want to estimate the reproduction rate and find a way to determine the number of not registered infected individuals. The estimators will be applied to the data from Germany and we will discuss the results. KW - Covid-19 KW - Corona KW - Reproduktionsrate KW - Verzweigungsprozess KW - Modellierung KW - Covid-19 KW - corona virus KW - reproduction rate KW - branching process KW - modeling Y1 - 2021 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-509225 ER -