TY - THES A1 - Carrasco, Tomas T1 - Genome structure analysis and patterns of transposable elements evolution in the slow-evolving Testudines clade N2 - Transposable elements (TEs) are loci that can replicate and multiply within the genome of their host. Within the host, TEs through transposition are responsible for variation on genomic architecture and gene regulation across all vertebrates. Genome assemblies have increased in numbers in recent years. However, to explore in deep the variations within different genomes, such as SNPs (single nucleotide polymorphism), INDELs (Insertion-deletion), satellites and transposable elements, we need high-quality genomes. Studies of molecular markers in the past 10 years have limitations to correlate with biological differences because molecular markers rely on the accuracy of the genomic resources. This has generated that a substantial part of the studies of TE in recent years have been on high quality genomic resources such as Drosophila, zebrafinch and maize. As testudine have a slow mutation rate lower only to crocodilians, with more than 300 species, adapted to different environments all across the globe, the testudine clade can help us to study variation. Here we propose Testudines as a clade to study variation and the abundance of TE on different species that diverged a long time ago. We investigated the genomic diversity of sea turtles, identifying key genomic regions associated to gene family duplication, specific expansion of particular TE families for Dermochelyidae and that are important for phenotypic differentiation, the impact of environmental changes on their populations, and the dynamics of TEs within different lineages. In chapter 1, we identify that despite high levels of genome synteny within sea turtles, we identified that regions of reduced collinearity and microchromosomes showed higher concentrations of multicopy gene families, as well as genetic distances between species, indicating their potential importance as sources of variation underlying phenotypic differentiation. We found that differences in the ecological niches occupied by leatherback and green turtles have led to contrasting evolutionary paths for their olfactory receptor genes. We identified in leatherback turtles a long-term low population size. Nonetheless, we identify no correlation between the regions of reduced collinearity with abundance of TEs or an accumulation of a particular TE group. In chapter 2, we identified that sea turtle genomes contain a significant proportion of TEs, with differences in TE abundance between species, and the discovery of a recent expansion of Penelope-like elements (PLEs) in the highly conserved sea turtle genome provides new insights into the dynamics of TEs within Testudines. In chapter 3, we compared the proportion of TE across the Testudine clade, and we identified that the proportion of transposable elements within the clade is stable, regardless of the quality of the assemblies. However, we identified that the proportion of TEs orders has correlation with genome quality depending of their expanded abundancy. For retrotransposon, a highly abundant element for this clade, we identify no correlation. However, for DNA elements a rarer element on this clade, correlate with the quality of the assemblies. Here we confirm that high-quality genomes are fundamental for the study of transposable element evolution and the conservation within the clade. The detection and abundance of specific orders of TEs are influenced by the quality of the genomes. We identified that a reduction in the population size on D. coriacea had left signals of long-term low population sizes on their genomes. On the same note we identified an expansion of TE on D. coriacea, not present in any other member of the available genomes of Testudines, strongly suggesting that it is a response of deregulation of TE on their genomes as consequences of the low population sizes. Here we have identified important genomic regions and gene families for phenotypic differentiation and highlighted the impact of environmental changes on the populations of sea turtles. We stated that accurate classification and analysis of TE families are important and require high-quality genome assemblies. Using TE analysis we manage to identify differences in highly syntenic species. These findings have significant implications for conservation and provide a foundation for further research into genome evolution and gene function in turtles and other vertebrates. Overall, this study contributes to our understanding of evolutionary change and adaptation mechanisms. N2 - Transponierbare Elemente (TEs) sind Loci, die sich im Genom ihres Wirts replizieren und vermehren können. Innerhalb des Wirts sind TEs durch Transposition für die Variation der genomischen Architektur und der Genregulation bei allen Wirbeltieren verantwortlich. In den letzten Jahren hat die Zahl der Genomassemblies zugenommen. Um jedoch die Variationen innerhalb verschiedener Genome, wie SNPs, INDELs, Satelliten und transponierbare Elemente, eingehend zu untersuchen, benötigen wir qualitativ hochwertige Genome. Studien über molekulare Marker in den letzten 10 Jahren haben nur begrenzt mit biologischen Unterschieden korreliert, da molekulare Marker von der Genauigkeit der genomischen Ressourcen abhängen. Dies hat dazu geführt, dass ein großer Teil der TE-Studien der letzten Jahre an qualitativ hochwertigen genomischen Ressourcen wie Drosophila, Zebrafinken und Mais durchgeführt wurde. Da die Testudinen eine langsame Mutationsrate haben, die nur bei Krokodilen niedriger ist, aber mehr als 300 Arten umfassen, die an verschiedene Umgebungen auf der ganzen Welt angepasst sind, kann uns diese Gruppe bei der Untersuchung der Variation helfen. Hier schlagen wir Testudinen als Klade vor, um die Variation und die Häufigkeit von TE bei verschiedenen Arten zu untersuchen, die sich vor langer Zeit auseinanderentwickelt haben. Wir untersuchten die genomische Vielfalt der Meeresschildkröten und identifizierten genomische Schlüsselregionen, die mit der Duplikation von Genfamilien, der spezifischen Ausbreitung bestimmter TE-Familien bei den Dermochelyidae verbunden und für die phänotypische Differenzierung wichtig sind, sowie die Auswirkungen von Umweltveränderungen auf ihre Populationen und die Dynamik transponierbarer Elemente (TEs) innerhalb verschiedener Linien. In Kapitel 1 stellen wir fest, dass trotz des hohen Maßes an Genomsyntenie innerhalb der Meeresschildkröten Regionen mit geringerer Kollinearität und Mikrochromosomen eine höhere Konzentration von Genfamilien mit mehreren Kopien sowie genetische Abstände zwischen den Arten aufweisen, was auf ihre potenzielle Bedeutung als Variationsquellen für die phänotypische Differenzierung hinweist. Wir fanden heraus, dass die Unterschiede in den ökologischen Nischen, die Lederschildkröten und Suppenschildkröten besetzen, zu gegensätzlichen evolutionären Pfaden für ihre Geruchsrezeptorgene geführt haben. Bei Lederschildkröten haben wir Anzeichen für langfristig niedrige Populationsgrößen festgestellt. Dennoch konnten wir keine Korrelation zwischen den Regionen mit reduzierter Kollinearität und der Häufigkeit von TEs oder einer Akkumulation einer bestimmten TE-Gruppe feststellen. In Kapitel 2 haben wir festgestellt, dass die Genome von Meeresschildkröten einen beträchtlichen Anteil an TEs enthalten, mit Unterschieden in der TE-Häufigkeit zwischen den Arten, und die Entdeckung einer kürzlichen Ausbreitung von Penelope-ähnlichen Elementen (PLEs) im hochkonservierten Genom von Meeresschildkröten bietet neue Einblicke in die Dynamik von TEs innerhalb der Testudinen. In Kapitel 3 haben wir den Anteil der TE innerhalb der Testudinenklade verglichen und festgestellt, dass der Anteil der transponierbaren Elemente innerhalb der Klade stabil ist, unabhängig von der Qualität der Assemblies. Allerdings haben wir festgestellt, dass der Anteil der TEs Bestellungen hat Korrelation mit Genom Qualität in Abhängigkeit von ihrer erweiterten Häufigkeit, wie auf Retrotransposon, ein sehr häufig Element für diese Klade, wir identifizieren keine Korrelation, aber, DNA-Elemente ein seltener Element auf dieser Klade, korrelieren mit der Qualität der Baugruppen. Hier bestätigen wir, dass qualitativ hochwertige Genome für die Untersuchung der Entwicklung transponierbarer Elemente und der Erhaltung innerhalb der Gruppe von grundlegender Bedeutung sind. Der Nachweis und die Häufigkeit bestimmter Ordnungen von TEs werden durch die Qualität der Genome beeinflusst. Wir haben festgestellt, dass eine Verringerung der Populationsgröße bei D. coriacea Signale für langfristig niedrige Populationsgrößen in ihren Genomen hinterlassen hat. Gleichzeitig haben wir bei D. coriacea eine Ausdehnung der TE festgestellt, die in keinem anderen Mitglied der verfügbaren Genome der Testudinen vorkommt, was stark darauf hindeutet, dass es sich um eine Reaktion auf die Deregulierung der TE auf ihren Genomen als Folge der geringen Populationsgrößen handelt. Hier haben wir wichtige genomische Regionen und Genfamilien für die phänotypische Differenzierung identifiziert und die Auswirkungen von Umweltveränderungen auf die Populationen von Meeresschildkröten aufgezeigt. Wir haben festgestellt, dass eine genaue Klassifizierung und Analyse von TE-Familien wichtig ist und qualitativ hochwertige Genomassemblies erfordert. Mit Hilfe der TE-Analyse gelingt es uns, Unterschiede in hochsynthetischen Arten zu identifizieren. Diese Ergebnisse sind von großer Bedeutung für den Artenschutz und bilden eine Grundlage für die weitere Erforschung der Genomevolution und der Genfunktionen bei Schildkröten und anderen Wirbeltieren. Insgesamt trägt diese Studie zu unserem Verständnis des evolutionären Wandels und der Anpassungsmechanismen bei. KW - transposable elements KW - Chelonia mydas KW - Dermochelys coriacea KW - evolutionary biology KW - Transponierbare Elemente KW - Chelonia mydas KW - Dermochelys coriacea KW - Evolutionsbiologie Y1 - 2023 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-606577 ER - TY - THES A1 - Derežanin, Lorena T1 - Contribution of structural variation to adaptive evolution of mammalian genomes T1 - Beteiligung der strukturellen Variation zur adaptiven Evolution von Säugetiergenomen N2 - Following the extinction of dinosaurs, the great adaptive radiation of mammals occurred, giving rise to an astonishing ecological and phenotypic diversity of mammalian species. Even closely related species often inhabit vastly different habitats, where they encounter diverse environmental challenges and are exposed to different evolutionary pressures. As a response, mammals evolved various adaptive phenotypes over time, such as morphological, physiological and behavioural ones. Mammalian genomes vary in their content and structure and this variation represents the molecular mechanism for the long-term evolution of phenotypic variation. However, understanding this molecular basis of adaptive phenotypic variation is usually not straightforward. The recent development of sequencing technologies and bioinformatics tools has enabled a better insight into mammalian genomes. Through these advances, it was acknowledged that mammalian genomes differ more, both within and between species, as a consequence of structural variation compared to single-nucleotide differences. Structural variant types investigated in this thesis - such as deletion, duplication, inversion and insertion, represent a change in the structure of the genome, impacting the size, copy number, orientation and content of DNA sequences. Unlike short variants, structural variants can span multiple genes. They can alter gene dosage, and cause notable gene expression differences and subsequently phenotypic differences. Thus, they can lead to a more dramatic effect on the fitness (reproductive success) of individuals, local adaptation of populations and speciation. In this thesis, I investigated and evaluated the potential functional effect of structural variations on the genomes of mustelid species. To detect the genomic regions associated with phenotypic variation I assembled the first reference genome of the tayra (Eira barbara) relying on linked-read sequencing technology to achieve a high level of genome completeness important for reliable structural variant discovery. I then set up a bioinformatics pipeline to conduct a comparative genomic analysis and explore variation between mustelid species living in different environments. I found numerous genes associated with species-specific phenotypes related to diet, body condition and reproduction among others, to be impacted by structural variants. Furthermore, I investigated the effects of artificial selection on structural variants in mice selected for high fertility, increased body mass and high endurance. Through selective breeding of each mouse line, the desired phenotypes have spread within these populations, while maintaining structural variants specific to each line. In comparison to the control line, the litter size has doubled in the fertility lines, individuals in the high body mass lines have become considerably larger, and mice selected for treadmill performance covered substantially more distance. Structural variants were found in higher numbers in these trait-selected lines than in the control line when compared to the mouse reference genome. Moreover, we have found twice as many structural variants spanning protein-coding genes (specific to each line) in trait-selected lines. Several of these variants affect genes associated with selected phenotypic traits. These results imply that structural variation does indeed contribute to the evolution of the selected phenotypes and is heritable. Finally, I suggest a set of critical metrics of genomic data that should be considered for a stringent structural variation analysis as comparative genomic studies strongly rely on the contiguity and completeness of genome assemblies. Because most of the available data used to represent reference genomes of mammalian species is generated using short-read sequencing technologies, we may have incomplete knowledge of genomic features. Therefore, a cautious structural variation analysis is required to minimize the effect of technical constraints. The impact of structural variants on the adaptive evolution of mammalian genomes is slowly gaining more focus but it is still incorporated in only a small number of population studies. In my thesis, I advocate the inclusion of structural variants in studies of genomic diversity for a more comprehensive insight into genomic variation within and between species, and its effect on adaptive evolution. N2 - Nach dem Aussterben der Dinosaurier kam es zu einer großen adaptiven Radiation der Säugetiere, die eine erstaunliche ökologische und phänotypische Vielfalt von Säugetierarten hervorbrachte. Selbst eng verwandte Arten bewohnen oft sehr unterschiedliche Lebensräume, in denen sie verschiedenen Umwelteinflüssen und evolutionärem Druck ausgesetzt sind. Als Reaktion darauf haben Säugetiere im Laufe der Zeit verschiedene adaptive Phänotypen entwickelt, z. B. morphologische, physiologische und verhaltensbezogene. Die Genome von Säugetieren variieren in ihrem Inhalt und ihrer Struktur, und diese Variation stellt den molekularen Mechanismus für die langfristige Evolution der phänotypischen Variation dar. Das Verständnis dieser molekularen Grundlage der adaptiven phänotypischen Variation ist jedoch meist nicht trivial. Die jüngste Entwicklung von Sequenzierungstechnologien und Bioinformatik-Tools hat einen besseren Einblick in die Genome von Säugetieren ermöglicht. Durch diese Fortschritte wurde erkannt, dass sich die Genome von Säugetieren sowohl innerhalb als auch zwischen den Arten stärker durch strukturelle Variationen als durch Unterschiede zwischen einzelnen Nukleotiden unterscheiden. Variantenarten, die in dieser Arbeit untersucht werden - wie Deletion, Duplikation, Inversion und Insertion - stellen eine Veränderung der Genomstruktur dar, die sich auf die Größe, die Kopienzahl, die richtung und den Inhalt der DNA-Sequenzen auswirken. Im Gegensatz zu kurzen Varianten können strukturelle Varianten mehrere Gene umfassen. Sie können die Genkopien verändern und bemerkenswerte Unterschiede in der Genexpression und in der Folge phänotypische Unterschiede hervorrufen. Dadurch können sie dramatischere Auswirkungen auf die Fitness (den Fortpflanzungserfolg) von Individuen, die lokale Anpassung von Populationen und die Artbildung haben. In dieser Arbeit untersuchte und bewertete ich die potenziellen funktionellen Auswirkungen von strukturellen Variationen auf die Genome von Mustelidenarten. Weil für die zuverlässige Entdeckung struktureller Varianten ein hohes Maß an Genomvollständigkeit wichtig ist, habe ich das erste Referenzgenom der Tayra (Eira barbara) mit Hilfe der Linked-Read-Sequenzierungstechnologie zusammengestellt, um die mit der phänotypischen Variation verbundenen Genomregionen zu ermitteln. Anschließend habe ich eine Bioinformatik-Pipeline aufgesetzt, um eine vergleichende Genomanalyse durchzuführen und die Variationen zwischen den in unterschiedlichen Umgebungen lebenden Mustelidenarten zu untersuchen. Ich fand heraus, dass zahlreiche Gene, die mit artspezifischen Phänotypen in Verbindung stehen, durch strukturelle Variationen beeinflusst werden. Diese Phänotypen stehen u.a. in Zusammenhang mit Ernährung, Körperzustand und Fortpflanzung. Darüber hinaus untersuchte ich die Auswirkungen der künstlichen Selektion auf strukturelle Variationen bei Mäusen, die auf hohe Fruchtbarkeit, erhöhte Körpermasse und hohe Ausdauer selektiert wurden. Durch selektive Züchtung jeder Mauslinie haben sich die gewünschten Phänotypen innerhalb dieser Populationen durchgesetzt, wobei die für jede Linie spezifischen strukturellen Variationen erhalten blieben. Im Vergleich zur Kontrolllinie hat sich die Wurfgröße in den Linien selektiert auf Fruchtbarkeit verdoppelt, die Individuen in den Linien mit hoher Körpermasse sind erheblich größer geworden, und die auf Laufbandleistung selektierten Mäuse haben wesentlich mehr Strecke zurückgelegt. Im Vergleich zum Referenzgenom der Maus wurden in diesen nach Merkmalen selektierten Linien mehr strukturelle Variationen gefunden als in der Kontrolllinie. Darüber hinaus fanden wir doppelt so viele strukturelle Variationen, die proteinkodierende Gene überspannen (spezifisch für jede Linie), in nach Merkmalen selektierten Linien. Mehrere dieser Varianten betreffen Gene, die mit ausgewählten phänotypischen Merkmalen in Verbindung stehen. Diese Ergebnisse deuten darauf hin, dass strukturelle Variationen tatsächlich zur Evolution der ausgewählten Phänotypen beiträgt und vererbbar ist. Abschließend schlage ich eine Sammlung von maßgeblichen Metriken für Genomdaten vor, die für eine strenge Analyse der strukturellen Variation berücksichtigt werden sollten, da vergleichende Genomstudien in hohem Maße von der Kontiguität und Vollständigkeit der Genomassemblies abhängen. Weil die meisten der verfügbaren Daten, die verwendet wurden, um Referenzgenome von Säugetierarten zu repräsentieren mit Short-Read-Sequenzierungstechnologien erzeugt wurden, verfügen wir möglicherweise nur über unvollständige Kenntnisse der genomischen Merkmale. Daher ist eine vorsichtige Analyse der strukturellen Variationen erforderlich, um die Auswirkungen technischer Beschränkungen zu minimieren. Der Einfluss struktureller Variationen auf die adaptive Evolution von Säugetiergenomen rückt langsam immer mehr in den Mittelpunkt, wird aber immer noch nur in wenigen Populationsstudien berücksichtigt. In meiner Dissertation befürworte ich die Einbeziehung struktureller Variationen in Studien zur genomischen Diversität, um einen umfassenderen Einblick in die genomische Variation innerhalb und zwischen den Arten und ihre Auswirkungen auf die adaptive Evolution zu erhalten. KW - doctoral thesis KW - evolutionary biology KW - adaptation KW - genomics KW - Adaptation KW - Dissertation KW - Evolutionsbiologie KW - Genomik Y1 - 2023 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-591443 ER -