TY - THES A1 - Westbury, Michael V. T1 - Unraveling evolution through Next Generation Sequencing T1 - Entschlüsselung von Evolution durch Sequenzierung der nächsten Generation N2 - The sequencing of the human genome in the early 2000s led to an increased interest in cheap and fast sequencing technologies. This interest culminated in the advent of next generation sequencing (NGS). A number of different NGS platforms have arisen since then all promising to do the same thing, i.e. produce large amounts of genetic information for relatively low costs compared to more traditional methods such as Sanger sequencing. The capabilities of NGS meant that researchers were no longer bound to species for which a lot of previous work had already been done (e.g. model organisms and humans) enabling a shift in research towards more novel and diverse species of interest. This capability has greatly benefitted many fields within the biological sciences, one of which being the field of evolutionary biology. Researchers have begun to move away from the study of laboratory model organisms to wild, natural populations and species which has greatly expanded our knowledge of evolution. NGS boasts a number of benefits over more traditional sequencing approaches. The main benefit comes from the capability to generate information for drastically more loci for a fraction of the cost. This is hugely beneficial to the study of wild animals as, even when large numbers of individuals are unobtainable, the amount of data produced still allows for accurate, reliable population and species level results from a small selection of individuals. The use of NGS to study species for which little to no previous research has been carried out on and the production of novel evolutionary information and reference datasets for the greater scientific community were the focuses of this thesis. Two studies in this thesis focused on producing novel mitochondrial genomes from shotgun sequencing data through iterative mapping, bypassing the need for a close relative to serve as a reference sequence. These mitochondrial genomes were then used to infer species level relationships through phylogenetic analyses. The first of these studies involved reconstructing a complete mitochondrial genome of the bat eared fox (Otocyon megalotis). Phylogenetic analyses of the mitochondrial genome confidently placed the bat eared fox as sister to the clade consisting of the raccoon dog and true foxes within the canidae family. The next study also involved reconstructing a mitochondrial genome but in this case from the extinct Macrauchenia of South America. As this study utilised ancient DNA, it involved a lot of parameter testing, quality controls and strict thresholds to obtain a near complete mitochondrial genome devoid of contamination known to plague ancient DNA studies. Phylogenetic analyses confidently placed Macrauchenia as sister to all living representatives of Perissodactyla with a divergence time of ~66 million years ago. The third and final study of this thesis involved de novo assemblies of both nuclear and mitochondrial genomes from brown and striped hyena and focussed on demographic, genetic diversity and population genomic analyses within the brown hyena. Previous studies of the brown hyena hinted at very low levels of genomic diversity and, perhaps due to this, were unable to find any notable population structure across its range. By incorporating a large number of genetic loci, in the form of complete nuclear genomes, population structure within the brown hyena was uncovered. On top of this, genomic diversity levels were compared to a number of other species. Results showed the brown hyena to have the lowest genomic diversity out of all species included in the study which was perhaps caused by a continuous and ongoing decline in effective population size that started about one million years ago and dramatically accelerated towards the end of the Pleistocene. The studies within this thesis show the power NGS sequencing has and its utility within evolutionary biology. The most notable capabilities outlined in this thesis involve the study of species for which no reference data is available and in the production of large amounts of data, providing evolutionary answers at the species and population level that data produced using more traditional techniques simply could not. N2 - Die Sequenzierung des ersten menschlichen Genoms Anfang der 2000er Jahre förderte das Interesse an kostengünstigen und gleichzeitig schnelleren Sequenziertechniken. Dieses Interesse erreichte seinen derzeitigen Höhepunkt in der Einführung des sogenannten Next Generation Sequencings (NGS). Seitdem wurden zahlreiche NGS-Plattformen entwickelt, die alle dem gleichen Prinzip folgen, nämlich das Erzeugen großer Mengen genetischer Information zu relativ geringen Preisen verglichen mit herkömmlichen Methoden wie der Sanger-Sequenzierung. Die neue Leistungsfähigkeit von NGS bedeutete, dass Forscher nicht mehr länger an Organismen gebunden waren an denen bereits seit Jahren geforscht wurde (bspw. Modellorganismen oder der Mensch), sondern ermöglichte eine Verschiebung in Richtung neuerer und unterschiedlicher Arten von Interesse. Dieses Potential hat viele Wissenschaftsfelder positiv beeinflusst innerhalb der Biowissenschaften, u.a. das Feld der Evolutionsbiologie. Forscher haben angefangen sich zunehmend von Modellorganismen in Laboratorien wegzubewegen hinzu wildlebenden, natürlich vorkommenden Populationen und Arten, was unser Verständnis von Evolution maßgeblich erweitert hat. NGS hat mehrere Vorteile aufzuweisen gegenüber den herkömmlichen Sequenziermethoden. Der wohl größte Vorteil ist die Gewinnung genetischer Daten für mehrere Genorte (Loci) gleichzeitig zu einem Bruchteil der bisherigen Kosten. Das ist besonders nützlich für die Untersuchung wildlebender Tiere da, selbst wenn nicht ausreichend viele Individuen vorliegen, die gewonnene Menge an Daten genaue und verlässliche Ergebnisse auf Populations- sowie Artebene für eine kleine Auswahl an Individuen liefert. Die Verwendung von NGS zur Untersuchung von Arten, für die bisher wenig oder gar keine vorherigen Forschungsergebnisse vorliegen sowie die Gewinnung neuartiger Informationen im Bereich Evolution ebenso wie die Erstellung eines Referenzdatensatzes, der der wissenschaftlichen Gemeinschaft zur Verfügung gestellt werden kann, waren der Fokus dieser Arbeit. Zwei Studien in dieser Arbeit setzten ihren Fokus in der Gewinnung noch nicht publizierter, mitochondrialer Genome, die mittels iterative mapping erstellt wurden und so das Vorhandensein einer Referenzsequenz eines nahen Verwandten der untersuchten Art unnötig machten. In beiden Fällen wurden Shotgun Sequenzierungsdaten verwendet. Die so gewonnenen mitochondrialen Genome wurden dann genutzt, um innerartliche Verwandtschaftsverhältnisse mit hilfe von phylogenetischen Analysen zu klären. Die erste Studie befasste sich mit der Rekonstruktion des kompletten mitochondrialen Genoms des Löffelhundes (Otocyon megalotis). Die phylogenetische Analyse des mitochondrialen Genoms positionierten den Löffelhund sicher als Schwestergruppe der Klade bestehend aus Marderhund und echten Füchsen innerhalb der Familie Canidae. Die zweite Studie hat sich ebenfalls mit der Rekonstruktion eines mitochondrialen Genoms auseinandergesetzt, diesmal von einer bereits ausgestorbenen Art Südamerikas, dem Macrauchenia. Da diese Studie auf sehr alter DNA (ancient DNA) basiert, schließt sie viele Parametertests, Qualitätskontrollen sowie strenge Filterkriterien ein um ein fast vollständiges mitochondriales Genom erhalten zu können, frei von den für ancient DNA typischen Kontaminationen. Phylogenetische Analysen positionieren Macrauchenia als Schwestergruppe zu allen anderen lebenden Vertretern der Perissodactyla mit einer Abspaltung vor ~66 Millionen Jahren. Die dritte und letzte Studie dieser Arbeit beinhaltet die de novo Konstruktionen von nukleären und mitochondrialen Genomen der Schabracken- und Streifenhyäne mit Fokus auf demographische, genetische Diversität sowie Populationsgenomische Analysen innerhalb der Schabrackenhyänen. Vorausgehende Studien an der Schabrackenhyäne gaben Hinweise für einen geringen Grad an genomischer Diversität und, waren vielleicht deshalb, bisher nicht in der Lage eine nennenswerte Populationsstruktur der Schabrackenhyäne aufzudecken. Zusätzlich wurde die genomische Diversität mit der von einer Reihe anderer Arten verglichen. Die Ergebnisse zeigen, dass die Schabrackenhyäne die niedrigste genomische Diversität aufweist im Vergleich zu den in dieser Studie verwendeten Arten, was vielleicht mit einem kontinuierlichen und fortschreitenden Rückgang der effektiven Populationsgröße dieser Spezies zu erklären ist, der vor ca. einer Million Jahre eingesetzt hat und dramatisch zugenommen hat zum Ende des Pleistozän. Die Studien dieser Arbeit zeigen das Potential von NGS Sequenzierung und ihren Nutzen innerhalb der Evolutionsbiologie. Die nennenswertesten Anwendungen von NGS, die in dieser Arbeit hervorgehoben wurden, sind zum Einen der Nutzen für Organismen bzw. Arten für die es keine verfügbaren Referenzdaten gibt sowie zum Anderen die Gewinnung von großen Datenmengen, die die Grundlage bilden zur Beantwortung evolutionsbiologischer Fragestellungen auf Art- und Populationsebene, was vorhergegangene, traditionelle Methoden bisher nicht leisten konnten. KW - Next generation sequencing KW - Evolution KW - Hyena KW - Evolution KW - Hyäne KW - Sequenzierung der nächsten Generation Y1 - 2018 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-409981 ER - TY - THES A1 - Bysani Kondagari, Viswanada Reddy T1 - Engineering and evolution of saccharomyces cerevisiae for synthetic formatotrophic growth via the reductive glycine pathway N2 - Increasing demand for food, healthcare, and transportation arising from the growing world population is accompanied by and driving global warming challenges due to the rise of the atmospheric CO2 concentration. Industrialization for human needs has been increasingly releasing CO2 into the atmosphere for the last century or more. In recent years, the possibility of recycling CO2 to stabilize the atmospheric CO2 concentration and combat rising temperatures has gained attention. Thus, using CO2 as the feedstock to address future world demands is the ultimate solution while controlling the rapid climate change. Valorizing CO2 to produce activated and stable one-carbon feedstocks like formate and methanol and further upgrading them to industrial microbial processes to replace unsustainable feedstocks would be crucial for a future biobased circular economy. However, not all microbes can grow on formate as a feedstock, and those microbes that can grow are not well established for industrial processes. S. cerevisiae is one of the industrially well-established microbes, and it is a significant contributor to bioprocess industries. However, it cannot grow on formate as a sole carbon and energy source. Thus, engineering S. cerevisiae to grow on formate could potentially pave the way to sustainable biomass and value-added chemicals production. The Reductive Glycine Pathway (RGP), designed as the aerobic twin of the anaerobic Reductive Acetyl-CoA pathway, is an efficient formate and CO2 assimilation pathway. The RGP comprises of the glycine synthesis module (Mis1p, Gcv1p, Gcv2p, Gcv3p, and Lpd1p), the glycine to serine conversion module (Shmtp), the pyruvate synthesis module (Cha1p), and the energy supply module (Fdh1p). The RGP requires formate and elevated CO2 levels to operate the glycine synthesis module. In this study, I established the RGP in the yeast system using growth-coupled selection strategies to achieve formate and CO2-dependent biomass formation in aerobic conditions. Firstly, I constructed serine biosensor strains by disrupting the native serine and glycine biosynthesis routes in the prototrophic S288c and FL100 yeast strains and insulated serine, glycine, and one-carbon metabolism from the central metabolic network. These strains cannot grow on glucose as the sole carbon source but require the supply of serine or glycine to complement the engineered auxotrophies. Using growth as a readout, I employed these strains as selection hosts to establish the RGP. Initially, to achieve this, I engineered different serine-hydroxymethyltransferases in the genome of serine biosensor strains for efficient glycine to serine conversion. Then, I implemented the glycine synthesis module of the RGP in these strains for the glycine and serine synthesis from formate and CO2. I successfully conducted Adaptive Laboratory Evolution (ALE) using these strains, which yielded a strain capable of glycine and serine biosynthesis from formate and CO2. Significant growth improvements from 0.0041 h-1 to 0.03695 h-1 were observed during ALE. To validate glycine and serine synthesis, I conducted carbon tracing experiments with 13C formate and 13CO2, confirming that more than 90% of glycine and serine biosynthesis in the evolved strains occurs via the RGP. Interestingly, labeling data also revealed that 10-15% of alanine was labelled, indicating pyruvate synthesis from the formate-derived serine using native serine deaminase (Cha1p) activity. Thus, RGP contributes to a small pyruvate pool which is converted to alanine without any selection pressure for pyruvate synthesis from formate. Hence, this data confirms the activity of all three modules of RGP even in the presence of glucose. Further, ALE in glucose limiting conditions did not improve pyruvate flux via the RGP. Growth characterization of these strains showed that the best growth rates were achieved in formate concentrations between 25 mM to 300 mM. Optimum growth required 5% CO2, and dropped when the CO2 concentration was reduced from 5% to 2.5%. Whole-genome sequencing of these evolved strains revealed mutations in genes that encode Gdh1p, Pet9p, and Idh1p. These enzymes might influence intracellular NADPH, ATP, and NADH levels, indicating adjustment to meet the energy demand of the RGP. I reverse-engineered the GDH1 truncation mutation on unevolved serine biosensor strains and reproduced formate dependent growth. To elucidate the effect of the GDH1 mutation on formate assimilation, I reintroduced this mutation in the S288c strain and conducted carbon-tracing experiments to compared formate assimilation between WT and ∆gdh1 mutant strains. Comparatively, enhanced formate assimilation was recorded in the ∆gdh1 mutant strain. Although the 13C carbon tracing experiments confirmed the activity of all three modules of the RGP, the overall pyruvate flux via the RGP might be limited by the supply of reducing power. Hence, in a different approach, I overexpressed the formate dehydrogenase (Fdh1p) for energy supply and serine deaminase (Cha1p) for active pyruvate synthesis in the S288c parental strain and established growth on formate and serine without glucose in the medium. Further reengineering and evolution of this strain with a consistent energy, and formate-derived serine supply for pyruvate synthesis, is essential to achieve complete formatotrophic growth in the yeast system. N2 - Die steigende Nachfrage nach Lebensmitteln, Gesundheitsfürsorge und Transportmitteln durch die stetig wachsende Weltbevölkerung, sorgen für eine dramatisch fortschreitende globale Erwärmung; verursacht durch den massiven weltweiten CO2 Ausstoß. Durch die Industrialisierung wurde im vergangenen Jahrhundert immer mehr CO2 in die Atmosphäre freigesetzt. Recycling von CO2 hat in den letzten Jahren an Aufmerksamkeit gewonnen, um die steigenden Temperaturen zu stabilisieren. CO2 ist somit der ultimative Rohstoff, um den künftigen weltweiten Bedarf zu decken und gleichzeitig den raschen Klimawandel zu kontrollieren. Die Verwendung von CO2 zur Herstellung von aktivierten Ein-Kohlenstoff-Verbindungen wie Formiat und Methanol und die weitere Aufwertung durch mikrobielle Prozesse, wäre für die biobasierte Kreislaufwirtschaft von entscheidender Bedeutung. Allerdings können die allermeisten Mikroorganismen auf den genannten Ein-Kohlenstoffverbindungen- als Ausgangsstoff nicht wachsen und diejenigen, dies es können sind für industrielle Prozesse nicht geeignet. S. cerevisiae gehört zu den industriell etablierten Mikroorganismen und leistet einen wichtigen Beitrag zur Bioprozessindustrie. Sie kann jedoch nicht auf Formiat als einziger Kohlenstoff- und Energiequelle wachsen. Die biotechnologische Anpassung von S. cerevisiae für das Wachstum auf Formiat könnte daher nachhaltige Wege für die Produktion von Biomasse und wertschöpfenden Chemikalien ebnen. Der Reduktive Glycinweg (RGP), der als aerober Zwilling des anaeroben Reduktiven Acetyl-CoA-Wegs konzipiert wurde, ist ein effizienter Formiat- und CO2 Assimilationsweg. Der RGP besteht aus dem Glycin-Synthesemodul (Mis1p, Gcv1p, Gcv2p, Gcv3p und Lpd1p), dem Modul zur Umwandlung von Glycin in Serin (Shmtp), dem Pyruvat-Synthesemodul (Cha1p) und dem Energieversorgungsmodul (Fdh1p). Der RGP benötigt Formiat und erhöhte CO2 Verfügbarkeit, um das Glycin-Synthesemodul zu betreiben. In dieser Studie habe ich das RGP im Hefesystem mit wachstumsgekoppelten Selektionsstrategien etabliert, um ein von Formiat und CO2 abhängiges zelluläres Wachstum unter aeroben Bedingungen zu erreichen. Zunächst habe ich Serin-Biosensor-Stämme konstruiert, indem ich die nativen Serin- und Glycin-Biosynthesewege in den prototrophen Stämmen S288c und FL100 unterbrochen und den Serin-, Glycin- und Ein-Kohlenstoff-Stoffwechsel vom zentralen Stoffwechselnetz isoliert habe. Diese Stämme können nicht mit Glukose als alleinige Kohlenstoffquelle wachsen, sondern benötigen die Zufuhr von Serin oder Glycin, um die eingeführten Auxotrophien zu ergänzen. Unter Verwendung von zellulärem Wachstum als Indikator, habe ich diese Stämme als Selektionswirte verwendet, um den RGP zu etablieren. Zu diesem Zweck habe ich durch genomische Integration von Serin-Hydroxymethyltransferasen (SHMTs) in diese Biosensorstämme effiziente Module zur Umwandlung von Glycin in Serin geschaffen. Dann implementierte ich das Glycin-Modul des RGP in die Stämme für die Glycin- und Serinsynthese aus Formiat und CO2. Mit diesen Stämmen führte ich erfolgreich eine adaptive Laborevolution (ALE) durch, die einen Stamm hervorbrachte, der zur Glycin- und Serinbiosynthese aus Ameisensäure und CO2 fähig ist. Während der ALE wurden signifikante Wachstumsverbesserungen von 0,0041 h-1 auf 0,03695 h-1 beobachtet. Um die Glycin- und Serinsynthese zu bestätigen, führte ich Experimente zur Kohlenstoffverfolgung mit 13C-Formiat und 13CO2 durch, die bestätigten, dass mehr als 90% der Glycin- und Serinbiosynthese über den RGP erfolgt. Interessanterweise ergaben die Markierungsdaten auch 10-15% markiertes Alanin, was auf eine Pyruvatsynthese aus dem von Formiat abgeleiteten Serin durch die native Serindeaminase (Cha1p) hinweist. Somit trägt der RGP zu einem kleinen Pyruvat-Pool bei, ohne dass ein Selektionsdruck für die Pryuvat Synthese aus Formiat besteht. Diese Daten bestätigen somit die Aktivität aller drei Module von RGP auch in Gegenwart von Glukose. Weitere ALE unter glukoselimitierenden Bedingungen verbesserte den Pyruvatfluss aus dem RGP allerdings nicht. Die Wachstumscharakterisierung der beschriebnen Stämme zeigte, dass die besten Wachstumsraten bei Formiatkonzentrationen zwischen 25 mM und 300 mM erzielt wurden. Für optimales Wachstum wurde 5% CO2 benötigt und die Wachstumsrate verschlechterte sich bei einer CO2 Konzentration von 2.5 %. Die Sequenzierung des gesamten Genoms dieser weiterentwickelten Stämme ergab Mutationen in Genen, die für Gdh1p, Pet9p und Idh1p kodieren. Diese Enzyme beeinflussen den intrazellulären NADPH-, ATP- und NADH-Spiegel, was auf den Energiebedarf für die Aktivität des RGP hinweist. Ich habe die GDH1-Mutation in nicht evolvierte Serin-Biosensor-Stämme eingebracht und damit das von Formiat und CO2 abhängige Wachstum reproduziert. Um die Auswirkung der GDH1-Mutation auf die Formationsassimilation zu klären, habe ich diese Mutation in den WT-Stamm eingeführt und ein Experiment zur Kohlenstoffverfolgung mit 13C-Formiat und Glukose durchgeführt. Es wurde nachgewiesen, dass die gdh1-Mutante im Vergleich zum WT-Stamm eine verbesserte Assimilation aufweist. Obwohl die 13C-Isotopenmarkierung die Aktivität aller drei Module der RGP bestätigte, könnte der Gesamtpyruvatfluss über den RGP durch die Versorgung mit Redox-Äuquivalenten begrenzt sein. In einem anderen Ansatz wurden daher die Formiatdehydrogenase (Fdh1p) für die Energieversorgung und die Serindesaminase (Cha1p) für die aktive Pyruvatsynthese überexprimiert und ein Wachstum mit Formiat und Serin ohne Glukose in der WT-Hefe festgestellt. Die weitere Entwicklung des gesamten Stoffwechsels in Kombination mit Evolutionsstrategien,und einer aus Formiat gewonnenen Serin- und Energiezufuhr für die Pyruvatsynthese ist unerlässlich, um ein vollständiges formatotrophes Wachstum im Hefesystem zu erreichen. KW - synthetic formatotrphy KW - green house gases KW - CHO-THF, CH-THF, CH2-THF, and CH3-THF KW - reductive glycine pathway KW - reductive acetyl-CoA pathway KW - glycine decarboxylase complex (=GCV) KW - glycine cleavage system KW - glycine synthase complex (reversal of GCV) KW - One-carbon KW - 10-Formyltetrahydrofolate KW - 5,10-Methenyltetrahydrofolate KW - 5,10-Methylenetetrahydrofolate KW - 5-Methyltetrahydrofolate KW - serine hydroxymethyltransferase KW - serine biosensor KW - adaptive laboratory evolution KW - next generation sequencing KW - Treibhausgase KW - Rahmenübereinkommen der Vereinten Nationen über Klimaänderungen KW - reduktiver Glycinweg KW - reduktiver Acetyl-CoA-Weg KW - Glycin-Spaltsystem KW - Glycin-Decarboxylase-Komplex (=GCV) KW - Glycin-Synthase-Komplex (Umkehrung von GCV) KW - Ein Kohlenstoff KW - 10-Formyltetrahydrofolat KW - 5,10-Methenyltetrahydrofolat KW - 5-Methyltetrahydrofolat KW - CHO-THF, CH-THF, CH2-THF und CH3-THF KW - 3-Phosphoglycerinsäure KW - Serin-Hydroxymethyltransferase KW - Serin-Biosensor KW - Evolutionsrunde KW - adaptive Laborentwicklung KW - Sequenzierung der nächsten Generation KW - Codierungssequenz KW - autonom replizierende Sequenz Y1 - 2023 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-582222 ER -