ERA-NET: ERA CAPS
Wissenschaftsdisziplinen
Biologie (100%)
Keywords
-
Arabidopsis thaliana,
Population genetics,
Natural variation,
Epigenomics,
Structural variation,
Gene annotation
Wie sich genetische Variation im äußerlichen Erscheinungsbild eines Individuums auswirkt, und wie dieser Genotyp-Phänotyp Zusammenhang von der Umwelt abhängt, ist eine der größten Fragen der modernen Biologie und fundamental sowohl für die Humangenetik, die Agrarwirtschaft, aber auch für die Evolutionsbiologie. Aufgrund der technologischen Fortschritte der letzten Jahre können wir nun beginnen, uns mit dieser Fragestellung zu befassen. Dazu werden Genome ganzer Populationen sequenziert und diese Daten mit den Phänotyp-Daten verknüpft. Das können beispielsweise Daten der Gesundheitsbehörden oder Ernteerträge sein, aber auch die Fähigkeit, wie Pflanzen in einem kontrollierten Experiment oder in ihrer natürlichen Umgebung mit Stress umgehen. Ein wichtiger Aspekt dabei wird aber häufig bei diesen (oft auch sehr öffentlichkeitswirksamen) Studien übersehen: Wir befinden uns noch weit weg von einer umfassenden Beschreibung der genetischen Variation einer Population. Das next generation Sequenzieren, welches uns ein wirtschaftlich vertretbares Screening einer großen Anzahl von Individuen ermöglicht hat, erzeugt eigentlich keine kompletten Genomsequenzen: In Wirklichkeit produziert es eine riesige Zahl sehr kurzer Sequenzfragmente, die dann mit einem Referenzgenom abgestimmt werden. Durch diesen Vergleich werden die Varianten gefunden. Aufgrund dieser Vorgangsweise können nur sehr einfache Varianten, wie Einzelnukleotid-Polymorphismen oder sehr kurze Insertions/Deletions Polymorphismen festgestellt werden. Außerdem sind die Resultate schon allein durch den Vergleich mit einem willkürlich ausgewählten Referenzgenom zwangsläufig verfälscht, da dieses Referenzgenom schon seine individuellen Abweichungen aufweist. Darüber hinaus werden große oder komplexe strukturelle Varianten, sowie einfache Varianten innerhalb dieser komplexen Varianten, im Allgemeinen völlig übersehen. Wir wissen derzeit nicht, wie gravierend dieses Problem ist. Der Grund dafür ist, dass man dafür eine sehr große Anzahl von Genomen komplett zusammenbauen und diese dann mit Daten vergleichen müsste, die durch Standardmethoden ermittelt worden sind. Genau das ist das Ziel des 1001G+ Projektantrages. Die Entwicklung des long-read Sequenzieren ist nun so weit fortgeschritten, dass es uns zumindest bei Organismen mit relativ kleinem Genom möglich ist, nahezu das komplette Genom für viele Individuen neu zu generieren. Aufbauend auf den Erfolg und die Erfahrungen unseres 1001 Genomes Project wollen wir mindestens 50 Genome aus unterschiedlichen Arabidopsis thaliana-Stämmen neu zusammenbauen. Wir werden sie mit Informationen über ihre Transkriptome und Epigenom-Information ergänzen und Werkzeuge dazu entwickeln, um die Ergebnisse der Forschungs-Gemeinschaft zur Verfügung stellen zu können. Es ist noch ein langer Weg bis zur Antwort auf die Frage, was im für uns derzeit noch nicht sichtbaren Teil des Genoms versteckt ist. Wir forschen mit A. thaliana. Die Ergebnisse dieses Projekts und die Werkzeuge und Plattformen, die wir zur Datenfindung, Interpretation und zum Verbreiten der neu gefundenen Informationen entwickeln werden, können aber den Weg für ähnliche Studien an anderen Organismen freimachen. Dabei denken wir an Organismen mit größeren Genomen, bei denen die versteckten Teile des Genoms größer und wahrscheinlich auch wichtiger sind. Unser Projekt vereint ein Team von Forschern mit sehr unterschiedlichen sich ergänzenden Fertigkeiten und Qualifikationen. Sie verfügen über beachtliche Managementerfahrung und haben bereits erfolgreich für die Forschungs-Gemeinschaft interessante Resultate gemeinsam erarbeitet. Darüber hinaus wird in regelmäßig stattfindenden Meetings mit Wissenschaftlern anderer, nicht involvierter Forschungsinstitute die breitere Relevanz des Projekts laufend evaluiert werden.
Zu verstehen, wie genetische Variation in phänotypische Variation umgesetzt wird und wie diese Umsetzung von der Umwelt abhängt, ist eine große Herausforderung für die moderne Biologie. Sie ist von grundlegender Bedeutung für die Landwirtschaft, die Humangenetik und die Landwirtschaft sowie die Evolutionsbiologie. Dank des technologischen Fortschritts ist es heute möglich, diese Frage durch die Sequenzierung ganzer Populationen zu beantworten und diese Informationen mit phänotypischen Daten zu verknüpfen, seien es Aufzeichnungen über die öffentliche Gesundheit, Daten über Ernteerträge oder die Fähigkeit, Stress in einem kontrollierten Experiment oder in der Natur zu widerstehen. Da wir uns bemühen, die Folgen des Klimawandels abzumildern, ist es von entscheidender Bedeutung zu verstehen, wie die Evolution dieses Problem durch genetische Anpassung an lokale Umgebungen angegangen ist. Es gibt jedoch einen wichtigen Aspekt, der bei all diesen (oft sehr öffentlichkeitswirksamen) Bemühungen oft übersehen wird: Wir sind noch weit davon entfernt, die genetische Variation auf Populationsebene vollständig zu beschreiben. Die "Next-Generation"-Sequenzierungsmethoden, die es wirtschaftlich möglich gemacht haben, eine große Anzahl von Individuen zu untersuchen (das fast schon mythische "1000-Dollar-Human-Genom"), erzeugen keine vollständigen Genomsequenzen, sondern eine riesige Anzahl sehr kurzer Sequenzfragmente, die an ein Referenzgenom angeglichen werden müssen, um Varianten zu identifizieren. Aus diesem Grund werden nur einfache Varianten (Einzelnukleotid- und sehr kurze Insertions-/Deletionspolymorphismen) gemeldet, und die Ergebnisse sind ausnahmslos verzerrt im Hinblick auf das, was im Referenzgenom vorhanden ist oder fehlt. Große oder komplexe strukturelle Varianten sowie einfache Varianten innerhalb komplexer Varianten werden im Allgemeinen völlig übersehen. Um zu untersuchen, wie schwerwiegend dieses Problem ist, haben wir die neueste Sequenzierungstechnologie eingesetzt, um über 100 Genome der Modellpflanze Arabidopsis thaliana vollständig zu generieren, und eine Ressource geschaffen, die es der Forschung ermöglicht, die vollständige Variation ihres Lieblingsgens oder ihrer Lieblingsgene in der Natur zu betrachten. Wir haben wichtige Variationsquellen identifiziert, wie z. B. mobile DNA, die die Fähigkeit besitzt, sich selbst zu kopieren und im Genom zu replizieren. Unser Projekt ergänzt ähnliche Forschungsarbeiten, die bei wichtigen Kulturpflanzen wie Reis, Soja und Tomate durchgeführt wurden.
- Detlef Weigel, Max Planck Institute Tübingen - Deutschland
- Paul Kersey, Royal Botanic Garden - Vereinigtes Königreich
Research Output
- 117 Zitationen
- 11 Publikationen
-
2023
Titel Additional file 1 of Extensive sequence duplication in Arabidopsis revealed by pseudo-heterozygosity DOI 10.6084/m9.figshare.22624478 Typ Other Autor Jaegle B Link Publikation -
2023
Titel Additional file 1 of Extensive sequence duplication in Arabidopsis revealed by pseudo-heterozygosity DOI 10.6084/m9.figshare.22624478.v1 Typ Other Autor Jaegle B Link Publikation -
2023
Titel Additional file 10 of Extensive sequence duplication in Arabidopsis revealed by pseudo-heterozygosity DOI 10.6084/m9.figshare.22624508 Typ Other Autor Jaegle B Link Publikation -
2023
Titel Additional file 10 of Extensive sequence duplication in Arabidopsis revealed by pseudo-heterozygosity DOI 10.6084/m9.figshare.22624508.v1 Typ Other Autor Jaegle B Link Publikation -
2023
Titel Extensive sequence duplication in Arabidopsis revealed by pseudo-heterozygosity. DOI 10.17863/cam.94739 Typ Other Autor Jaegle B Link Publikation -
2023
Titel Extensive sequence duplication in Arabidopsis revealed by pseudo-heterozygosity. DOI 10.17863/cam.95932 Typ Journal Article Autor Jaegle B Link Publikation -
2024
Titel Genetic basis of Arabidopsis thaliana responses to infection by naïve and adapted isolates of turnip mosaic virus DOI 10.7554/elife.89749.3 Typ Journal Article Autor Butkovic A Journal eLife Link Publikation -
2021
Titel Extensive gene duplication in Arabidopsis revealed by pseudo-heterozygosity DOI 10.1101/2021.11.15.468652 Typ Preprint Autor Jaegle B Seiten 2021.11.15.468652 Link Publikation -
2021
Titel Genetic variation, environment and demography intersect to shape Arabidopsis defense metabolite variation across Europe DOI 10.7554/elife.67784 Typ Journal Article Autor Katz E Journal eLife Link Publikation -
2023
Titel Extensive sequence duplication in Arabidopsis revealed by pseudo-heterozygosity DOI 10.1186/s13059-023-02875-3 Typ Journal Article Autor Jaegle B Journal Genome Biology Seiten 44 Link Publikation -
2022
Titel Pushing the limits of HiFi assemblies reveals centromere diversity between two Arabidopsis thaliana genomes DOI 10.1101/2022.02.15.480579 Typ Preprint Autor Rabanal F Seiten 2022.02.15.480579 Link Publikation