Parallele Datenverarbeitung zu Stammbaumrekonstruktion
Parallel computing for phylogenetic inference
DACH: Österreich - Deutschland - Schweiz
Wissenschaftsdisziplinen
Biologie (35%); Informatik (65%)
Keywords
-
Bioinformatic Tools,
High Performance Computing,
Algorithms,
Modeling,
Parallel Computer Architectures,
Statistical Inference
Bioinformatics is currently facing two challenges. Firstly, significant advances in sequencing techniques (454, Solexa) are generating an unprecedented amount of molecular data. Hence, data acquisition is no longer a problem but rather data analysis, especially in molecular evolution. Secondly, the field of parallel computing is facing the multi-core revolution on general purpose CPUs and a plethora of novel accelerator technologies such as GPUs (Graphics Processing Units). Therefore, parallel computing is becoming feasible at the level of personal computers. Nevertheless, biological data stored in public databases (e.g., GenBank) increases at a significantly higher rate than computational power. Thus, we need to substantially improve the respective models, data structures, and algorithms for data analysis. Here, we propose to tackle these challenges for the two closely related and intertwined fields of Statistical Multiple Sequence Alignment (sMSA) and Phylogenetic Inference (PI) via an integrated approach. We will develop a highly optimized, portable, parallelized, and versatile library for sMSA and PI. We will also improve statistical models for sMSA, search heuristics for PI, and integrate them in a next-generation bioinformatics tool for evolutionary biology. The underlying idea is to develop models and methods in such a way that they will be scalable on all modern multi-core, accelerator, and supercomputer architectures.
Im Rahmen der Fördermaßnahme wurden drei Ziele erreicht. Wir stellen eine open-source Library für phylogenetische Analysen basierend auf dem Maximum Likelihodd Prinzip zur Verfügung. Diese Library ist soweit optimiert, dass sie für paralleles Rechnen verwendet werden kann und dass sie wenig Rechenzeit benötigt. Diese Arbeiten wurden gemeinsam mit unserem Kollaborationspartner Alexandors Stamatakis (Heidelberg/Karlsruhe) durchgeführt. Zweitens, haben wir mit IQ-TREE einen neuartigen und extrem effizienten Algorithmus entwickelt, der es erlaubt phylogenetische Bäume aus DNA oder Aminosäuresequenzen in sehr kurzer Zeit zu berechnen. In IQ-TREE ist auch ein neuartiges Verfahren (UFBoot) zur Schätzung der Verlässlichkeit der geschätzten Stammbäume integriert worden, dass die Rechenzeit nochmals senkt. Damit ist IQ-TREE ein wichtiges Werkzeug für alle Labore, die sich mit evolutionsbiologischen Fragestellungen befassen. Im dritten Teil des Projekts wurde in Zusammenarbeit mit Dirk Metzler (München) ein Verfahren entwickelt, um die Unsicherheiten in multiplen Sequenz Alignments zu studieren. Grundlage für dieses Verfahren ist ein detailliertes Modell der Sequenzevolution.
- Universität Wien - 100%
Research Output
- 24159 Zitationen
- 10 Publikationen
-
2013
Titel Decisive Data Sets in Phylogenomics: Lessons from Studies on the Phylogenetic Relationships of Primarily Wingless Insects DOI 10.1093/molbev/mst196 Typ Journal Article Autor Dell’Ampio E Journal Molecular Biology and Evolution Seiten 239-249 Link Publikation -
2015
Titel Whole genome analysis of a Vietnamese trio DOI 10.1007/s12038-015-9501-0 Typ Journal Article Autor Hai D Journal Journal of Biosciences Seiten 113-124 -
0
Titel Terrace aware phylogenomic inference from supermatrices. Typ Other Autor Chernomor O -
2013
Titel Ultrafast Approximation for Phylogenetic Bootstrap DOI 10.1093/molbev/mst024 Typ Journal Article Autor Minh B Journal Molecular Biology and Evolution Seiten 1188-1195 Link Publikation -
2014
Titel Terrace Aware Phylogenomic Inference from Supermatrices DOI 10.48550/arxiv.1411.3480 Typ Preprint Autor Chernomor O -
2014
Titel IQ-TREE: A Fast and Effective Stochastic Algorithm for Estimating Maximum-Likelihood Phylogenies DOI 10.1093/molbev/msu300 Typ Journal Article Autor Nguyen L Journal Molecular Biology and Evolution Seiten 268-274 Link Publikation -
2014
Titel Split diversity in constrained conservation prioritization using integer linear programming DOI 10.1111/2041-210x.12299 Typ Journal Article Autor Chernomor O Journal Methods in Ecology and Evolution Seiten 83-91 Link Publikation -
2014
Titel Discovery of the first light-dependent protochlorophyllide oxidoreductase in anoxygenic phototrophic bacteria DOI 10.1111/mmi.12719 Typ Journal Article Autor Kaschner M Journal Molecular Microbiology Seiten 1066-1078 Link Publikation -
2014
Titel A novel Fibroblast Growth Factor Receptor family member promotes neuronal outgrowth and synaptic plasticity in Aplysia DOI 10.1007/s00726-014-1803-2 Typ Journal Article Autor Pollak D Journal Amino Acids Seiten 2477-2488 Link Publikation -
2014
Titel The Phylogenetic Likelihood Library DOI 10.1093/sysbio/syu084 Typ Journal Article Autor Flouri T Journal Systematic Biology Seiten 356-362 Link Publikation