@article{HaeringRegerEwaldetal.2013, author = {H{\"a}ring, Tim and Reger, Birgit and Ewald, J{\"o}rg and Hothorn, Torsten and Schr{\"o}der-Esselbach, Boris}, title = {Predicting Ellenberg's soil moisture indicator value in the Bavarian Alps using additive georegression}, series = {Applied vegetation science : official organ of the International Association for Vegetation Science}, volume = {16}, journal = {Applied vegetation science : official organ of the International Association for Vegetation Science}, number = {1}, publisher = {Wiley-Blackwell}, address = {Hoboken}, issn = {1402-2001}, doi = {10.1111/j.1654-109X.2012.01210.x}, pages = {110 -- 121}, year = {2013}, abstract = {Questions Can forest site characteristics be used to predict Ellenberg indicator values for soil moisture? Which is the best averaged mean value for modelling? Does the distribution of soil moisture depend on spatial information? Location Bavarian Alps, Germany. Methods We used topographic, climatic and edaphic variables to model the mean soil moisture value as found on 1505 forest plots from the database WINALPecobase. All predictor variables were taken from area-wide geodata layers so that the model can be applied to some 250 000 ha of forest in the target region. We adopted methods developed in species distribution modelling to regionalize Ellenberg indicator values. Therefore, we use the additive georegression framework for spatial prediction of Ellenberg values with the R-library mboost, which is a feasible way to consider environmental effects, spatial autocorrelation, predictor interactions and non-stationarity simultaneously in our data. The framework is much more flexible than established statistical and machine-learning models in species distribution modelling. We estimated five different mboost models reflecting different model structures on 50 bootstrap samples in each case. Results Median R2 values calculated on independent test samples ranged from 0.28 to 0.45. Our results show a significant influence of interactions and non-stationarity in addition to environmental covariates. Unweighted mean indicator values can be modelled better than abundance-weighted values, and the consideration of bryophytes did not improve model performance. Partial response curves indicate meaningful dependencies between moisture indicator values and environmental covariates. However, mean indicator values <4.5 and >6.0 could not be modelled correctly, since they were poorly represented in our calibration sample. The final map represents high-resolution information of site hydrological conditions. Conclusions Indicator values offer an effect-oriented alternative to physically-based hydrological models to predict water-related site conditions, even at landscape scale. The presented approach is applicable to all kinds of Ellenberg indicator values. Therefore, it is a significant step towards a new generation of models of forest site types and potential natural vegetation.}, language = {en} } @phdthesis{Raetsch2001, author = {R{\"a}tsch, Gunnar}, title = {Robust boosting via convex optimization}, url = {http://nbn-resolving.de/urn:nbn:de:kobv:517-0000399}, school = {Universit{\"a}t Potsdam}, year = {2001}, abstract = {In dieser Arbeit werden statistische Lernprobleme betrachtet. Lernmaschinen extrahieren Informationen aus einer gegebenen Menge von Trainingsmustern, so daß sie in der Lage sind, Eigenschaften von bisher ungesehenen Mustern - z.B. eine Klassenzugeh{\"o}rigkeit - vorherzusagen. Wir betrachten den Fall, bei dem die resultierende Klassifikations- oder Regressionsregel aus einfachen Regeln - den Basishypothesen - zusammengesetzt ist. Die sogenannten Boosting Algorithmen erzeugen iterativ eine gewichtete Summe von Basishypothesen, die gut auf ungesehenen Mustern vorhersagen. Die Arbeit behandelt folgende Sachverhalte: o Die zur Analyse von Boosting-Methoden geeignete Statistische Lerntheorie. Wir studieren lerntheoretische Garantien zur Absch{\"a}tzung der Vorhersagequalit{\"a}t auf ungesehenen Mustern. K{\"u}rzlich haben sich sogenannte Klassifikationstechniken mit großem Margin als ein praktisches Ergebnis dieser Theorie herausgestellt - insbesondere Boosting und Support-Vektor-Maschinen. Ein großer Margin impliziert eine hohe Vorhersagequalit{\"a}t der Entscheidungsregel. Deshalb wird analysiert, wie groß der Margin bei Boosting ist und ein verbesserter Algorithmus vorgeschlagen, der effizient Regeln mit maximalem Margin erzeugt. o Was ist der Zusammenhang von Boosting und Techniken der konvexen Optimierung? Um die Eigenschaften der entstehenden Klassifikations- oder Regressionsregeln zu analysieren, ist es sehr wichtig zu verstehen, ob und unter welchen Bedingungen iterative Algorithmen wie Boosting konvergieren. Wir zeigen, daß solche Algorithmen benutzt werden koennen, um sehr große Optimierungsprobleme mit Nebenbedingungen zu l{\"o}sen, deren L{\"o}sung sich gut charakterisieren laesst. Dazu werden Verbindungen zum Wissenschaftsgebiet der konvexen Optimierung aufgezeigt und ausgenutzt, um Konvergenzgarantien f{\"u}r eine große Familie von Boosting-{\"a}hnlichen Algorithmen zu geben. o Kann man Boosting robust gegen{\"u}ber Meßfehlern und Ausreissern in den Daten machen? Ein Problem bisheriger Boosting-Methoden ist die relativ hohe Sensitivit{\"a}t gegen{\"u}ber Messungenauigkeiten und Meßfehlern in der Trainingsdatenmenge. Um dieses Problem zu beheben, wird die sogenannte 'Soft-Margin' Idee, die beim Support-Vector Lernen schon benutzt wird, auf Boosting {\"u}bertragen. Das f{\"u}hrt zu theoretisch gut motivierten, regularisierten Algorithmen, die ein hohes Maß an Robustheit aufweisen. o Wie kann man die Anwendbarkeit von Boosting auf Regressionsprobleme erweitern? Boosting-Methoden wurden urspr{\"u}nglich f{\"u}r Klassifikationsprobleme entwickelt. Um die Anwendbarkeit auf Regressionsprobleme zu erweitern, werden die vorherigen Konvergenzresultate benutzt und neue Boosting-{\"a}hnliche Algorithmen zur Regression entwickelt. Wir zeigen, daß diese Algorithmen gute theoretische und praktische Eigenschaften haben. o Ist Boosting praktisch anwendbar? Die dargestellten theoretischen Ergebnisse werden begleitet von Simulationsergebnissen, entweder, um bestimmte Eigenschaften von Algorithmen zu illustrieren, oder um zu zeigen, daß sie in der Praxis tats{\"a}chlich gut funktionieren und direkt einsetzbar sind. Die praktische Relevanz der entwickelten Methoden wird in der Analyse chaotischer Zeitreihen und durch industrielle Anwendungen wie ein Stromverbrauch-{\"U}berwachungssystem und bei der Entwicklung neuer Medikamente illustriert.}, language = {en} }