TY  - THES
A1  - Händel, Annabel
T1  - Ground-motion model selection and adjustment for seismic hazard analysis
T1  - Auswahl und Anpassung von Bodenbewegungsmodellen für die seismische Gefährdungsanalyse
N2  - Erdbeben können starke Bodenbewegungen erzeugen und es ist wichtig, diese in einer seismischen Gefährdungsanalyse korrekt vorherzusagen. Üblicherweise werden dazu empirisch ermittelte Bodenbewegungsmodelle (GMPE) in einem logischen Baum zusammengefügt. Wenn jedoch die Bodenbewegung in einem Gebiet mit geringer Seismizität bestimmen werden soll, dann fehlen in der Regel die Daten, um regionsspezifische GMPEs zu entwickeln. In diesen Fällen ist es notwendig, auf Modelle aus anderen Gebieten mit guter Datengrundlage zurückzugreifen und diese an die Zielregion anzupassen. Zur korrekten Anpassung werden seismologische Informationen aus der Zielregion wie beispielsweise  die standortspezifische Dämpfung kappa0 benötigt. Diese Parameter lassen sich jedoch ebenfalls nur unzuverlässig bestimmen, wenn die Datengrundlage schlecht ist.

In meiner Dissertation beschäftige ich mich daher mit der Auswahl von GMPEs für den logischen Baum beziehungsweise deren Anpassung an Regionen mit geringer Seismizität. Ich folge dabei zwei  verschiedenen Strategien.

Im ersten Ansatz geht es um das Aufstellen eines logischen Baumes, falls kein regionsspezifisches Modell vorhanden ist. Ich stelle eine Methode vor, in der mehrere regionsfremde Modelle zu einem Mixmodell zusammengefügt werden. Die Modelle werden dabei je nach ihrer Eignung gewichtet und die Gewichte mittels der wenigen verfügbaren Daten aus der Zielregion ermittelt. Ein solches Mixmodell kann als sogenanntes 'Backbone'-Modell verwendet werden, welches in der Lage ist, mittlere Bodenbewegungen in der Zielregion korrekt vorherzusagen. Ich teste diesen Ansatz für  Nordchile und acht GMPEs, die für verschiedene Subduktionszonen auf der Welt entwickelt wurden. Die Resultate zeigen, dass das Mixmodell bessere Ergebnisse liefert als die einzelnen GMPEs, die zu seiner Erzeugung genutzt wurden. Es ist außerdem ebenso gut in der Vorhersage von Bodenbewegungen wie ein Regressionsmodell, welches extra für Nordchile entwickelt wurde.

Im zweiten Ansatz beschäftige ich mich mit der Bestimmung der standortspezifischen Dämpfung kappa0. kappa0 ist einer der wichtigsten Parameter zur Anpassung eines GMPEs an eine andere Region. Mein Ziel ist es, kappa0 aus seismischer Bodenunruhe anstelle von Erdbeben zu ermitteln, da diese kontinuierlich aufgezeichnet wird. Mithilfe von Interferometrie kann die Geschwindigkeit und Dämpfung von seismischen Wellen im Untergrund bestimmt werden. Dazu werden lange Aufzeichnungsreihen seismischer Bodenunruhe entweder kreuzkorreliert oder entfaltet (Dekonvolution). Die Bestimmung der Dämpfung aus Bodenunruhe bei Frequenzen über 1 Hz und in geringen Tiefen ist jedoch nicht trivial. Ich zeige in meiner Dissertation die Ergebnisse von zwei Studien. In der ersten Studie wird die Dämpfung von Love-Wellen zwischen 1-4 Hz für ein kleines Testarray in Griechenland ermittelt. In der zweiten Studie verwende ich die Daten einer Bohrloch und einer Oberflächenstation aus dem Vogtland, um die Dämpfung von S-Wellen zwischen  5-15 Hz zu bestimmen. Diese beiden Studien stellen jedoch nur den Ausgangspunkt für  zukünftige Untersuchungen dar, in denen kappa0 direkt aus der seismischer Bodenunruhe hergeleitet werden soll.
N2  - The prediction of the ground shaking that can occur at a site of interest due to an earthquake is  crucial in any seismic hazard analysis. Usually, empirically derived ground-motion prediction equations (GMPEs) are employed within a logic-tree framework to account for this step. This is, however, challenging if the area under consideration has only low seismicity and lacks enough recordings to develop a region-specific GMPE. It is then usual practice to adapt GMPEs from data-rich regions (host area) to the area with insufficient ground-motion recordings (target area). Host GMPEs must be adjusted in such a way that they will capture the specific ground-motion characteristics of the target area. In order to do so, seismological parameters of the target region have to be provided as, for example, the site-specific attenuation factor kappa0. This is again an intricate task if data amount is too sparse to derive these parameters.

In this thesis, I explore methods that can facilitate the selection of non-endemic GMPEs in a logic-tree analysis or their adjustment to a data-poor region. I follow two different strategies towards this goal.

The first approach addresses the setup of a ground-motion logic tree if no indigenous GMPE is available. In particular, I propose a method to derive an optimized backbone model that captures the median ground-motion characteristics in the region of interest. This is done by aggregating several foreign GMPEs as weighted components of a mixture model in which the weights are inferred from observed data. The approach is applied to Northern Chile, a region for which no indigenous GMPE existed at the time of the study. Mixture models are derived for interface and intraslab type events using eight subduction zone GMPEs originating from different parts of the world. The derived mixtures provide satisfying results in terms of average residuals and average sample log-likelihoods. They outperform all individual non-endemic GMPEs and are comparable to a regression model that was specifically derived for that area.

The second approach is concerned with the derivation of the site-specific attenuation factor kappa0. kappa0 is one of the key parameters in host-to-target adjustments of GMPEs but is hard to derive if data amount is sparse. I explore methods to estimate kappa0 from ambient seismic noise. Seismic noise is, in contrast to earthquake recordings, continuously available. The rapidly emerging field of seismic interferometry gives the possibility to infer velocity and attenuation information from the cross-correlation or deconvolution of long noise recordings. The extraction of attenuation parameters from diffuse wavefields is, however, not straightforward especially not for frequencies above 1 Hz and at shallow depth. In this thesis, I show the results of two studies. In the first one, data of a small-scale array experiment in Greece are used to derive Love wave quality factors in
the frequency range 1-4 Hz. In a second study, frequency dependent quality factors of S-waves (5-15 Hz) are estimated by deconvolving noise recorded in a borehole and at a co-located surface station in West Bohemia/Vogtland. These two studies can be seen as preliminary steps towards the estimation of kappa0 from seismic noise.
KW  - ground-motion models
KW  - GMPE adjustment
KW  - mixture models
KW  - seismic noise
KW  - seismic attenuation
KW  - Bodenbewegungsmodelle
KW  - Modellanpassung
KW  - Mixmodelle
KW  - Bodenunruhe
KW  - seismische Dämpfung
Y1  - 2018
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-418123
ER  - 
TY  - THES
A1  - Haider, Peter
T1  - Prediction with Mixture Models
T1  - Vorhersage mit Mischmodellen
N2  - Learning a model for the relationship between the attributes and the annotated labels of data examples serves two purposes. Firstly, it enables the prediction of the label for examples without annotation. Secondly, the parameters of the model can provide useful insights into the structure of the data. If the data has an inherent partitioned structure, it is natural to mirror this structure in the model. Such mixture models predict by combining the individual predictions generated by the mixture components which correspond to the partitions in the data. Often the partitioned structure is latent, and has to be inferred when learning the mixture model. Directly evaluating the accuracy of the inferred partition structure is, in many cases, impossible because the ground truth cannot be obtained for comparison. However it can be assessed indirectly by measuring the prediction accuracy of the mixture model that arises from it. This thesis addresses the interplay between the improvement of predictive accuracy by uncovering latent cluster structure in data, and further addresses the validation of the estimated structure by measuring the accuracy of the resulting predictive model. In the application of filtering unsolicited emails, the emails in the training set are latently clustered into advertisement campaigns. Uncovering this latent structure allows filtering of future emails with very low false positive rates. In order to model the cluster structure, a Bayesian clustering model for dependent binary features is developed in this thesis. Knowing the clustering of emails into campaigns can also aid in uncovering which emails have been sent on behalf of the same network of captured hosts, so-called botnets. This association of emails to networks is another layer of latent clustering. Uncovering this latent structure allows service providers to further increase the accuracy of email filtering and to effectively defend against distributed denial-of-service attacks. To this end, a discriminative clustering model is derived in this thesis that is based on the graph of observed emails. The partitionings inferred using this model are evaluated through their capacity to predict the campaigns of new emails. Furthermore, when classifying the content of emails, statistical information about the sending server can be valuable. Learning a model that is able to make use of it requires training data that includes server statistics. In order to also use training data where the server statistics are missing, a model that is a mixture over potentially all substitutions thereof is developed. Another application is to predict the navigation behavior of the users of a website. Here, there is no a priori partitioning of the users into clusters, but to understand different usage scenarios and design different layouts for them, imposing a partitioning is necessary. The presented approach simultaneously optimizes the discriminative as well as the predictive power of the clusters. Each model is evaluated on real-world data and compared to baseline methods. The results show that explicitly modeling the assumptions about the latent cluster structure leads to improved predictions compared to the baselines. It is beneficial to incorporate a small number of hyperparameters that can be tuned to yield the best predictions in cases where the prediction accuracy can not be optimized directly.
N2  - Das Lernen eines Modells für den Zusammenhang zwischen den Eingabeattributen und annotierten Zielattributen von Dateninstanzen dient zwei Zwecken. Einerseits ermöglicht es die Vorhersage des Zielattributs für Instanzen ohne Annotation. Andererseits können die Parameter des Modells nützliche Einsichten in die Struktur der Daten liefern. Wenn die Daten eine inhärente Partitionsstruktur besitzen, ist es natürlich, diese Struktur im Modell widerzuspiegeln. Solche Mischmodelle generieren Vorhersagen, indem sie die individuellen Vorhersagen der Mischkomponenten, welche mit den Partitionen der Daten korrespondieren, kombinieren. Oft ist die Partitionsstruktur latent und muss beim Lernen des Mischmodells mitinferiert werden. Eine direkte Evaluierung der Genauigkeit der inferierten Partitionsstruktur ist in vielen Fällen unmöglich, weil keine wahren Referenzdaten zum Vergleich herangezogen werden können. Jedoch kann man sie indirekt einschätzen, indem man die Vorhersagegenauigkeit des darauf basierenden Mischmodells misst. Diese Arbeit beschäftigt sich mit dem Zusammenspiel zwischen der Verbesserung der Vorhersagegenauigkeit durch das Aufdecken latenter Partitionierungen in Daten, und der Bewertung der geschätzen Struktur durch das Messen der Genauigkeit des resultierenden Vorhersagemodells. Bei der Anwendung des Filterns unerwünschter E-Mails sind die E-Mails in der Trainingsmende latent in Werbekampagnen partitioniert. Das Aufdecken dieser latenten Struktur erlaubt das Filtern zukünftiger E-Mails mit sehr niedrigen Falsch-Positiv-Raten. In dieser Arbeit wird ein Bayes'sches Partitionierunsmodell entwickelt, um diese Partitionierungsstruktur zu modellieren. Das Wissen über die Partitionierung von E-Mails in Kampagnen hilft auch dabei herauszufinden, welche E-Mails auf Veranlassen des selben Netzes von infiltrierten Rechnern, sogenannten Botnetzen, verschickt wurden. Dies ist eine weitere Schicht latenter Partitionierung. Diese latente Struktur aufzudecken erlaubt es, die Genauigkeit von E-Mail-Filtern zu erhöhen und sich effektiv gegen verteilte Denial-of-Service-Angriffe zu verteidigen. Zu diesem Zweck wird in dieser Arbeit ein diskriminatives Partitionierungsmodell hergeleitet, welches auf dem Graphen der beobachteten E-Mails basiert. Die mit diesem Modell inferierten Partitionierungen werden via ihrer Leistungsfähigkeit bei der Vorhersage der Kampagnen neuer E-Mails evaluiert. Weiterhin kann bei der Klassifikation des Inhalts einer E-Mail statistische Information über den sendenden Server wertvoll sein. Ein Modell zu lernen das diese Informationen nutzen kann erfordert Trainingsdaten, die Serverstatistiken enthalten. Um zusätzlich Trainingsdaten benutzen zu können, bei denen die Serverstatistiken fehlen, wird ein Modell entwickelt, das eine Mischung über potentiell alle Einsetzungen davon ist. Eine weitere Anwendung ist die Vorhersage des Navigationsverhaltens von Benutzern einer Webseite. Hier gibt es nicht a priori eine Partitionierung der Benutzer. Jedoch ist es notwendig, eine Partitionierung zu erzeugen, um verschiedene Nutzungsszenarien zu verstehen und verschiedene Layouts dafür zu entwerfen. Der vorgestellte Ansatz optimiert gleichzeitig die Fähigkeiten des Modells, sowohl die beste Partition zu bestimmen als auch mittels dieser Partition Vorhersagen über das Verhalten zu generieren. Jedes Modell wird auf realen Daten evaluiert und mit Referenzmethoden verglichen. Die Ergebnisse zeigen, dass das explizite Modellieren der Annahmen über die latente Partitionierungsstruktur zu verbesserten Vorhersagen führt. In den Fällen bei denen die Vorhersagegenauigkeit nicht direkt optimiert werden kann, erweist sich die Hinzunahme einer kleinen Anzahl von übergeordneten, direkt einstellbaren Parametern als nützlich.
KW  - maschinelles Lernen
KW  - Vorhersage
KW  - Clusteranalyse
KW  - Mischmodelle
KW  - machine learning
KW  - prediction
KW  - clustering
KW  - mixture models
Y1  - 2013
U6  - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus-69617
ER  -