TY - THES A1 - Rajasundaram, Dhivyaa T1 - Integrative analysis of heterogeneous plant cell wall related data T1 - Integrative Analyse von heterogenen Pflanzenzellwand-Daten N2 - Plant cell walls are complex structures that underpin plant growth and are widely exploited in diverse human activities thus placing them with a central importance in biology. Cell walls have been a prominent area of research for a long time, but the chemical complexity and diversity of cell walls not just between species, but also within plants, between cell-types, and between cell wall micro-domains pose several challenges. Progress accelerated several-fold in cell wall biology owing to advances in sequencing technology, aided soon thereafter by advances in omics and imaging technologies. This development provides additional perspectives of cell walls across a rapidly growing number of species, highlighting a myriad of architectures, compositions, and functions. Furthermore, rather than the component centric view, integrative analysis of the different cell wall components across system-levels help to gain a more in-depth understanding of the structure and biosynthesis of the cell envelope and its interactions with the environment. To this end, in this work three case studies are detailed, all pertaining to the integrative analysis of heterogeneous cell wall related data arising from different system-levels and analytical techniques. A detailed account of multiblock methods is provided and in particular canonical correlation and regression methods of data integration are discussed. In the first integrative analysis, by employing canonical correlation analysis - a multivariate statistical technique to study the association between two datasets - novel insight to the relationship between glycans and phenotypic traits is gained. In addition, sparse partial least squares regression approach that adapts Lasso penalization and allows for the selection of a subset of variables was employed. The second case study focuses on an integrative analysis of images obtained from different spectroscopic techniques. By employing yet another multiblock approach - multiple co-inertia analysis, insitu biochemical composition of cell walls from different cell-types is studied thereby highlighting the common and complementary parts of the two hyperspectral imaging techniques. Finally, the third integrative analysis facilitates gene expression analysis of the Arabidopsis root transcriptome and translatome for the identification of cell wall related genes and compare expression patterns of cell wall synthesis genes. The computational analysis considered correlation and variation of expression across cell-types at both system-levels, and also provides insight into the degree of co-regulatory relationships that are preserved between the two processes. The integrative analysis of glycan data and phenotypic traits in cotton fibers using canonical methods led to the identification of specific polysaccharides which may play a major role during fiber development for the final fiber characteristics. Furthermore, this analysis provides a base for future studies on glycan arrays in case of developing cotton fibers. The integrative analysis of images from infrared and Raman spectroscopic approaches allowed the coupling of different analytical techniques to characterize complex biological material, thereby, representing various facets of their chemical properties. Moreover, the results from the co-inertia analysis demonstrated that the study was well adapted as it is relevant for coupling data tables in a symmetric way. Several indicators are proposed to investigate how the global and block scores are related. In addition, studying the root cells of \textit{Arabidopsis thaliana} allowed positing a novel pipeline to systematically investigate and integrate the different levels of information available at the global and single-cell level. The conducted analysis also confirms that previously identified key transcriptional activators of secondary cell wall development display highly conserved patterns of transcription and translation across the investigated cell-types. Moreover, the biological processes that display conserved and divergent patterns based on the cell-type-specific expression and translation levels are identified. N2 - Pflanzliche Zellwände sind komplexe Strukturen, die wichtig für das Zellwachstum und auch nützlich für den Menschen sind, weshalb sie eine wichtige zentrale Rolle in der Biologie haben. Zellwände sind schon seit einiger Zeit ein bedeutsames Untersuchungsgebiet, jedoch stellen Fragen nach der chemischen Komplexizität und Diversität nicht nur zwischen Zellwänden verschiedener Spezies, sondern auch innerhalb von Pflanzen, zwischen verschiedenen Zelltypen und auch zwischen dem Mikro-Bereich von Zellwänden eine Herausforderung dar. Ein grosser Fortschritt in der Forschung konnte durch die Weiterentwicklung der Sequenziertechniken erzielt werden, sowie auch durch Fortschritte der "Omik"-Technologien und Imaging-Technologien. Dieser Fortschritt ermöglicht eine zusätzliche Perspektive auf Zellwände über die stark wachsende Anzahl verschiedener Spezies, die eine Vielzahl von Architekturen, Zusammensetzung und Funktionen hervorhebt. Des Weiteren werden statt einer Komponenten-zentrierten Sichtweise eine integrative Analyse der verschiedenen Zellwandkomponenten über unterschiedliche Systemebenen genutzt, um ein tieferes Verständnis über die Struktur und Biosynthese der Zellhülle und ihrer Wechselwirkung mit der Umgebung zu erlangen. Zu diesem Zweck werden in dieser Arbeit drei Fallstudien ausführlich beschrieben, die sich alle auf die integrative Analyse von heterogenen zellwandbezogenen Daten beziehen, die von unterschiedlichen Systemebenen und analystischen Techniken stammen. Eine detailierte Darstellung von Multiblock-Methoden wird verschafft, wobei besonders kanonische Korrelationsanalyse und Regressionsmethoden der Datenintegration diskutiert werden. In der ersten Studie werden unter Einsatz kanonischer Korrelationsanalyse - einer multivariaten statistischen Technik, um Zusammenhänge zwischen zwei Datensätzen zu ermitteln - angewendet, um neue Erkenntnisse in Bezug auf die Beziehungen zwischen Glycanen und phenotypischen Merkmalen zu erhalten. In der zweiten integrativen Analyse wird ein Sparse Partial Least Square Regressionsansatz verwendet, der Lasso Penalization anwendet und die Auswahl von einem Sub-Set von Variablen erlaubt. Ausserdem fokussiert sich die zweite Studie auch auf integrative Analyse von Bildern, die von zwei verschiedenen spektroskopischen Techniken aufgenommen wurden. Zunächst werden die zwei Sets von Bildern vor-bearbeitet und so aufbereitet, dass sie eine Blockdaten-Struktur bilden. Durch Anwendung eines weiteren Multiblock-Verfahrens, der multiple Co-Inertia Analyse, wird die in-situ biochemische Zusammensetzung der Zellwände von verschiedenen Zelltypen untersucht und die Gemeinsamkeiten und Unterschiede der zwei hyperspektralen Imaging-Techniken hervorgehoben. Zuletzt ermöglicht die dritte Studie eine integrative Genexpressions-Analyse des Arabidopsis Wurzeltranskriptoms und -translatoms zur Identifikation von zellwandbezogenen Genen und dem Vergleich von Expressionsmustern von Zellwandsynthese-Genen. Die numerische Analyse zieht sowohl Korrelation als auch Variation der Genexpression verschiedener Zelltypen auf den beiden Systemebenen in Betracht und liefert so einen Einblick in den Grad der ko-regulierten Beziehungen, die zwischen den beiden Prozessen konserviert sind. Die integrative Analyse der Glycandaten und den phenotypischen Merkmalen in Baumwollfasern unter Benutzung der kanonischen Methoden führte zur Identifikation von spezifischen Polysacchariden, welche eine wesentliche Rolle für die Entwicklung der finalen Fasereigenschaften spielen könnten. Weiterhin stellt diese Analyse eine Basis für zukünftige Studien über Glycanarrays von sich in der Entwicklung befindlichen Baumwollfasern dar. Die integrative Analyse von Bildern von Infrarot- und Raman-spektroskopischen Methoden erlaubt die Verknüpfung von verschiedenen analytischen Techniken, um komplexes biologisches Material zu charakterisieren, und somit eine Vielzahl ihrer chemischen Eigenschaften darzustellen. Dar über hinaus zeigen die Ergebnisse der Co-Inertia Analyse, dass die Studie gut adaptiert ist, was relevant für die symmetrische Verknüpfung von Datentabellen ist, aber auch weil mehrere Indikatoren vorgestellt wurden, um zu untersuchen, in wie fern die globalen und Block-Scores in Beziehung stehen. Ausserdem konnte durch die Untersuchung der Wurzelzellen von Arabidopsis thaliana eine neue Pipeline zur systematischen Untersuchung und Integration verschiedener Informationsebenen auf globaler und Einzelzellebene zuzüglich Identifikation von zellwandbezogenen Genen postuliert werden. Die ausgeführte Analyse bestätig auch, dass vorherige identifizierte Schlüssel-Transkriptionsfaktoren der sekundären Zellwandentwicklung hoch-konservierte Transkripions- und Translationsmuster in den untersuchten Zelltypen zeigen. Dazu kommt, dass biologischen Prozesse mit konservierten und divergenten Mustern auf zelltypspezifischer Expressions- und Translationebene identifiziert werden konnten. KW - pflanzliche Zellwände KW - "Omik"-Technologien KW - multivariate statistische Technik KW - integrative omics analysis KW - plant cell walls KW - canonical correlation analysis KW - regression methods Y1 - 2015 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-77652 ER -