Projektdetail

Grant-DOI 10.55776/I3684
Bewilligungssumme International - Multilaterale Initiativen
Status beendet
Projektbeginn 01.01.2018
Projektende 30.06.2021
Bewilligungssumme 355.542 €
Projekt-Website

Wissenschaftsdisziplinen

Biologie (100%)

Keywords

Arabidopsis thaliana,
Population genetics,
Natural variation,
Epigenomics,
Structural variation,
Gene annotation

Abstract

Zusammenfassung

Wie sich genetische Variation im äußerlichen Erscheinungsbild eines Individuums auswirkt, und wie dieser Genotyp-Phänotyp Zusammenhang von der Umwelt abhängt, ist eine der größten Fragen der modernen Biologie und fundamental sowohl für die Humangenetik, die Agrarwirtschaft, aber auch für die Evolutionsbiologie. Aufgrund der technologischen Fortschritte der letzten Jahre können wir nun beginnen, uns mit dieser Fragestellung zu befassen. Dazu werden Genome ganzer Populationen sequenziert und diese Daten mit den Phänotyp-Daten verknüpft. Das können beispielsweise Daten der Gesundheitsbehörden oder Ernteerträge sein, aber auch die Fähigkeit, wie Pflanzen in einem kontrollierten Experiment oder in ihrer natürlichen Umgebung mit Stress umgehen. Ein wichtiger Aspekt dabei wird aber häufig bei diesen (oft auch sehr öffentlichkeitswirksamen) Studien übersehen: Wir befinden uns noch weit weg von einer umfassenden Beschreibung der genetischen Variation einer Population. Das next generation Sequenzieren, welches uns ein wirtschaftlich vertretbares Screening einer großen Anzahl von Individuen ermöglicht hat, erzeugt eigentlich keine kompletten Genomsequenzen: In Wirklichkeit produziert es eine riesige Zahl sehr kurzer Sequenzfragmente, die dann mit einem Referenzgenom abgestimmt werden. Durch diesen Vergleich werden die Varianten gefunden. Aufgrund dieser Vorgangsweise können nur sehr einfache Varianten, wie Einzelnukleotid-Polymorphismen oder sehr kurze Insertions/Deletions Polymorphismen festgestellt werden. Außerdem sind die Resultate schon allein durch den Vergleich mit einem willkürlich ausgewählten Referenzgenom zwangsläufig verfälscht, da dieses Referenzgenom schon seine individuellen Abweichungen aufweist. Darüber hinaus werden große oder komplexe strukturelle Varianten, sowie einfache Varianten innerhalb dieser komplexen Varianten, im Allgemeinen völlig übersehen. Wir wissen derzeit nicht, wie gravierend dieses Problem ist. Der Grund dafür ist, dass man dafür eine sehr große Anzahl von Genomen komplett zusammenbauen und diese dann mit Daten vergleichen müsste, die durch Standardmethoden ermittelt worden sind. Genau das ist das Ziel des 1001G+ Projektantrages. Die Entwicklung des long-read Sequenzieren ist nun so weit fortgeschritten, dass es uns zumindest bei Organismen mit relativ kleinem Genom möglich ist, nahezu das komplette Genom für viele Individuen neu zu generieren. Aufbauend auf den Erfolg und die Erfahrungen unseres 1001 Genomes Project wollen wir mindestens 50 Genome aus unterschiedlichen Arabidopsis thaliana-Stämmen neu zusammenbauen. Wir werden sie mit Informationen über ihre Transkriptome und Epigenom-Information ergänzen und Werkzeuge dazu entwickeln, um die Ergebnisse der Forschungs-Gemeinschaft zur Verfügung stellen zu können. Es ist noch ein langer Weg bis zur Antwort auf die Frage, was im für uns derzeit noch nicht sichtbaren Teil des Genoms versteckt ist. Wir forschen mit A. thaliana. Die Ergebnisse dieses Projekts und die Werkzeuge und Plattformen, die wir zur Datenfindung, Interpretation und zum Verbreiten der neu gefundenen Informationen entwickeln werden, können aber den Weg für ähnliche Studien an anderen Organismen freimachen. Dabei denken wir an Organismen mit größeren Genomen, bei denen die versteckten Teile des Genoms größer und wahrscheinlich auch wichtiger sind. Unser Projekt vereint ein Team von Forschern mit sehr unterschiedlichen sich ergänzenden Fertigkeiten und Qualifikationen. Sie verfügen über beachtliche Managementerfahrung und haben bereits erfolgreich für die Forschungs-Gemeinschaft interessante Resultate gemeinsam erarbeitet. Darüber hinaus wird in regelmäßig stattfindenden Meetings mit Wissenschaftlern anderer, nicht involvierter Forschungsinstitute die breitere Relevanz des Projekts laufend evaluiert werden.

Zu verstehen, wie genetische Variation in phänotypische Variation umgesetzt wird und wie diese Umsetzung von der Umwelt abhängt, ist eine große Herausforderung für die moderne Biologie. Sie ist von grundlegender Bedeutung für die Landwirtschaft, die Humangenetik und die Landwirtschaft sowie die Evolutionsbiologie. Dank des technologischen Fortschritts ist es heute möglich, diese Frage durch die Sequenzierung ganzer Populationen zu beantworten und diese Informationen mit phänotypischen Daten zu verknüpfen, seien es Aufzeichnungen über die öffentliche Gesundheit, Daten über Ernteerträge oder die Fähigkeit, Stress in einem kontrollierten Experiment oder in der Natur zu widerstehen. Da wir uns bemühen, die Folgen des Klimawandels abzumildern, ist es von entscheidender Bedeutung zu verstehen, wie die Evolution dieses Problem durch genetische Anpassung an lokale Umgebungen angegangen ist. Es gibt jedoch einen wichtigen Aspekt, der bei all diesen (oft sehr öffentlichkeitswirksamen) Bemühungen oft übersehen wird: Wir sind noch weit davon entfernt, die genetische Variation auf Populationsebene vollständig zu beschreiben. Die "Next-Generation"-Sequenzierungsmethoden, die es wirtschaftlich möglich gemacht haben, eine große Anzahl von Individuen zu untersuchen (das fast schon mythische "1000-Dollar-Human-Genom"), erzeugen keine vollständigen Genomsequenzen, sondern eine riesige Anzahl sehr kurzer Sequenzfragmente, die an ein Referenzgenom angeglichen werden müssen, um Varianten zu identifizieren. Aus diesem Grund werden nur einfache Varianten (Einzelnukleotid- und sehr kurze Insertions-/Deletionspolymorphismen) gemeldet, und die Ergebnisse sind ausnahmslos verzerrt im Hinblick auf das, was im Referenzgenom vorhanden ist oder fehlt. Große oder komplexe strukturelle Varianten sowie einfache Varianten innerhalb komplexer Varianten werden im Allgemeinen völlig übersehen. Um zu untersuchen, wie schwerwiegend dieses Problem ist, haben wir die neueste Sequenzierungstechnologie eingesetzt, um über 100 Genome der Modellpflanze Arabidopsis thaliana vollständig zu generieren, und eine Ressource geschaffen, die es der Forschung ermöglicht, die vollständige Variation ihres Lieblingsgens oder ihrer Lieblingsgene in der Natur zu betrachten. Wir haben wichtige Variationsquellen identifiziert, wie z. B. mobile DNA, die die Fähigkeit besitzt, sich selbst zu kopieren und im Genom zu replizieren. Unser Projekt ergänzt ähnliche Forschungsarbeiten, die bei wichtigen Kulturpflanzen wie Reis, Soja und Tomate durchgeführt wurden.

Forschungsstätte(n)

Gregor Mendel Institute of Molecular Plant Biology - 100%

Internationale Projektbeteiligte

Detlef Weigel, Max Planck Institute Tübingen - Deutschland
Paul Kersey, Royal Botanic Garden - Vereinigtes Königreich

Research Output

123 Zitationen
11 Publikationen

Publikationen

Titel	Extensive gene duplication in Arabidopsis revealed by pseudo-heterozygosity
DOI	10.1101/2021.11.15.468652
Typ	Preprint
Autor	Jaegle B
Seiten	2021.11.15.468652
Link	Publikation

Titel	Pushing the limits of HiFi assemblies reveals centromere diversity between two Arabidopsis thaliana genomes
DOI	10.1101/2022.02.15.480579
Typ	Preprint
Autor	Rabanal F
Seiten	2022.02.15.480579
Link	Publikation

Titel	Extensive sequence duplication in Arabidopsis revealed by pseudo-heterozygosity.
DOI	10.17863/cam.95932
Typ	Journal Article
Autor	Jaegle B
Link	Publikation

Titel	Extensive sequence duplication in Arabidopsis revealed by pseudo-heterozygosity.
DOI	10.17863/cam.94739
Typ	Other
Autor	Jaegle B
Link	Publikation

Titel	Additional file 1 of Extensive sequence duplication in Arabidopsis revealed by pseudo-heterozygosity
DOI	10.6084/m9.figshare.22624478.v1
Typ	Other
Autor	Jaegle B
Link	Publikation

Titel	Additional file 10 of Extensive sequence duplication in Arabidopsis revealed by pseudo-heterozygosity
DOI	10.6084/m9.figshare.22624508
Typ	Other
Autor	Jaegle B
Link	Publikation

Titel	Additional file 10 of Extensive sequence duplication in Arabidopsis revealed by pseudo-heterozygosity
DOI	10.6084/m9.figshare.22624508.v1
Typ	Other
Autor	Jaegle B
Link	Publikation

Titel	Additional file 1 of Extensive sequence duplication in Arabidopsis revealed by pseudo-heterozygosity
DOI	10.6084/m9.figshare.22624478
Typ	Other
Autor	Jaegle B
Link	Publikation

Titel	Genetic variation, environment and demography intersect to shape Arabidopsis defense metabolite variation across Europe
DOI	10.7554/elife.67784
Typ	Journal Article
Autor	Katz E
Journal	eLife
Link	Publikation

Titel	Genetic basis of Arabidopsis thaliana responses to infection by naïve and adapted isolates of turnip mosaic virus
DOI	10.7554/elife.89749.3
Typ	Journal Article
Autor	Butkovic A
Journal	eLife
Link	Publikation

Titel	Extensive sequence duplication in Arabidopsis revealed by pseudo-heterozygosity
DOI	10.1186/s13059-023-02875-3
Typ	Journal Article
Autor	Jaegle B
Journal	Genome Biology
Seiten	44
Link	Publikation

Zur Übersichtsseite Entdecken

Zur Übersichtsseite Fördern

Zur Übersichtsseite Über uns

Zur Übersichtsseite Aktuelles

1001 Genome Plus

1001 Genomes Plus

Wissenschaftsdisziplinen

Keywords

Research Output

Kontakt

Allgemeines

Zur Übersichtsseite Entdecken

Zur Übersichtsseite Fördern

Zur Übersichtsseite Über uns

Zur Übersichtsseite Aktuelles

SOCIAL MEDIA

SCILOG

1001 Genome Plus

1001 Genomes Plus

Wissenschaftsdisziplinen

Keywords

Research Output