DACH: Österreich - Deutschland - Schweiz
Wissenschaftsdisziplinen
Biologie (30%); Informatik (70%)
Keywords
-
Genomics,
Phylogeny,
Sequence Evolution,
Molecular Systematics,
Evolution
Wir werden uns zwei Phänomenen widmen, welche dazu führen, uns im Raum der möglichen Stammbäume verloren zu fühlen. Einerseits werden wir topologische Diskordanzen zwischen Gen- und Speziesbäumen betrachten, welche einer Korrektur durch entsprechende Algorithmen bedürfen. Andererseits werden wir das Problem sog. Terrassen im phylogenetischen Suchraum eingehend betrachten. Das grundlegende Ziel ist es, besser zu charakterisieren warum wir im Raum der Bäume verloren sind und wie man diesen Raum zielgerichtet und effizienter traversieren und explorieren kann. Die spezifischen Teilprojekte fußen auf unserer erfolgreichen Kooperation in den vorhergegangenen Förderzeiträumen und der Erfahrung, welche unsere Nachwuchswissenschaftler in diesem Bereich bereits aufgebaut haben. Wir planen neue Methoden, Algorithmen sowie open source Software zu entwickeln, um (i) Stichproben, Aufzählungen und Statistiken von Bäumen, welche auf einer Terasse liegen zu berechnen, (ii) den von Terrassen durchsetzten Baumraum effizienter zu traversieren und (iii) skalierbare, effiziente und akkurate Genbaum - Speziesbaum Korrekturen durchzuführen. Biologische Bedeutung: Die biologische Relevanz unserer Forschung begründet sich darin, dass derzeit nur eine Handvoll einfach zu benutzender likelihood-basierter Programme zur Korrektur von Genbäumen anhand von Speziesbäume existiert. Obwohl gegenwärtig nur ein Prototyp unseres Programmes GeneRax existiert, wird dieser derzeit bereits von Biologen benutzt. Aufgrund der hohen Benutzerzahl von RAxML-NG und IQ-Tree bedeutet jegliche Verbesserung in deren Effizienz, dass Tausende CPU-Stunden eingespart werden können. Wie in (Dobrin, Zwickl, and Sanderson 2018) gezeigt, enthält eine Vielzahl gegenwärtiger phylogenetischer Datensätze Terrassen. Demzufolge ist das Problem keinesfalls rein theoretischer Natur, sondern mit einem tatsächlichen Problem empirischer Datensätze, welches angegangen werden muss. Sollten sich unsere vorläufigen Ergebnisse zu Quasi-Terrassen bestätigen (siehe WP .1.1), wird die Präsenz von Terrassen eine weitaus größere Anzahl empirischer Stammbaumanalysen betreffen, zumal diese dann weniger von Modellspezifika abhängen. Da Terassen hauptsächlich in Datensätzen mit fehlenden Daten auftreten, könnte man annehmen, dass die Analyse vollständiger Genome hier Abhilfe schaffen könnte. Dies ist jedoch nicht der Fall. Da biologische Diversität zum Teil aus Gendeletionen entsteht sind nicht alle Gene in den zu untersuchenden Spezies präsent. Daher stellt das fehlen von Gen- spezifischen Date in großen phylogenetischen Datensätzen eine inhärente Eigenschaft derselben dar. Demzufolge, stellt das Fehlen von (Gen-)Daten eine wichtige grundlegende Eigenschaft dar, welche systematisch in Stammbaumrekonstruktionssoftware berücksichtigt werde muss. Dies ist insbesondere für die Rekonstruktion des Stammbaums des Lebens unerlässlich, da dieser stark divergente Spezies mit sich stark unterscheidenden Genmengen enthält.
Wir haben bioinformatische Methoden entwickelt, um Stammbaumrekonstruktionsmethoden besser zu verstehen. Ein besonderer Schwerpunkt war das Problem multipler gleich guter Lösung, das wir mit einem speziell entwickelten Softwarewerkzeug auch für große Datensätze analysieren konnten.Darüber hinaus haben wir uns mit potentiellen Anwendungsmöglichkeiten von neuronalen Netzen in der Phylogenie befasst. Wir konnten zeigen, dass neuronale Netze sich effizient bei der Bestimmung der Sequenzevolution anwenden lassen und auch dazu beitragen können, verschiedene mögliche Stammbäume besser zu unterscheiden als bisherige Methoden. Hier eröffnet sich ein neues Anwendungsfeld für zukünftige Forschung.
- Universität Wien - 100%
Research Output
- 9976 Zitationen
- 10 Publikationen
- 6 Datasets & Models
- 1 Software
-
2023
Titel Gentrius: identifying equally scoring trees in phylogenomics with incomplete data DOI 10.1101/2023.01.19.524678 Typ Preprint Autor Chernomor O Seiten 2023.01.19.524678 Link Publikation -
2024
Titel Gentrius: Generating Trees Compatible With a Set of Unrooted Subtrees and its Application to Phylogenetic Terraces DOI 10.1093/molbev/msae219 Typ Journal Article Autor Chernomor O Journal Molecular Biology and Evolution Link Publikation -
2024
Titel Learning From an Artificial Neural Network in Phylogenetics DOI 10.1109/tcbb.2024.3352268 Typ Journal Article Autor Leuchtenberger A Journal IEEE/ACM Transactions on Computational Biology and Bioinformatics Seiten 278-288 Link Publikation -
2024
Titel Training and Interpretation of Artificial Neural Networks in Phylogenetics Typ PhD Thesis Autor Alina Leuchtenberger Link Publikation -
2023
Titel Parallel Inference of Phylogenetic Stands with Gentrius. Typ Conference Proceeding Abstract Autor Anastasis Togkousidis Konferenz 2023 IEEE International Parallel and Distributed Processing Symposium Workshops (IPDPSW) Seiten 139-143 Link Publikation -
2020
Titel IQ-TREE 2: New Models and Efficient Methods for Phylogenetic Inference in the Genomic Era DOI 10.1093/molbev/msaa015 Typ Journal Article Autor Minh B Journal Molecular Biology and Evolution Seiten 1530-1534 Link Publikation -
2020
Titel Distinguishing Felsenstein Zone from Farris Zone Using Neural Networks DOI 10.1093/molbev/msaa164 Typ Journal Article Autor Leuchtenberger A Journal Molecular Biology and Evolution Seiten 3632-3641 Link Publikation -
2023
Titel ModelRevelator: Fast phylogenetic model estimation via deep learning DOI 10.1016/j.ympev.2023.107905 Typ Journal Article Autor Burgstaller-Muehlbacher S Journal Molecular Phylogenetics and Evolution Seiten 107905 Link Publikation -
2022
Titel Molecular archaeology of human cognitive traits DOI 10.1016/j.celrep.2022.111287 Typ Journal Article Autor Kaczanowska J Journal Cell Reports Seiten 111287 Link Publikation -
2025
Titel When the Past Fades: Detecting Phylogenetic Signal with SatuTe DOI 10.1093/molbev/msaf090 Typ Journal Article Autor Manuel C Journal Molecular Biology and Evolution Link Publikation
-
2023
Link
Titel ModelRevelator Typ Data analysis technique Öffentlich zugänglich Link Link -
2023
Link
Titel Gentrius Parallelization Typ Data analysis technique Öffentlich zugänglich Link Link -
2023
Link
Titel Gentrius Algorithm Typ Data analysis technique Öffentlich zugänglich Link Link -
2020
Link
Titel FarFelDiscerner Typ Computer model/algorithm Öffentlich zugänglich Link Link -
2024
Link
Titel SatuTe Typ Data analysis technique Öffentlich zugänglich Link Link -
2024
Link
Titel EvoNAPS Typ Database/Collection of data Öffentlich zugänglich Link Link