RNOMIK
Computational RNomics
Wissenschaftsdisziplinen
Biologie (25%); Mathematik (75%)
Keywords
-
RNA Genes,
Bioinformatics,
Secondary Structure,
Non-coding RNA,
Alignments,
Motif search
Strukturbezogene Genomanalyse (Genomik), die systematische Bestimmung aller makromolekularen Strukturen, die in einem Genom vertreten sind, wird gegenwärtig fast ausschließlich in Bezug auf Proteine durchgeführt. Obwohl man im Allgemeinen von "Genen und durch sie kodierte Proteine" spricht, gibt es Tausende von menschlichen Genen, deren Transkripte ihre Funktion erfüllen, ohne jemals in Protein übersetzt zu werden. Darüber hinaus sind die funktionalen Inhalte von ca. der Hälfte des menschlichen Genoms nach wie vor nicht entschlüsselt, obwohl die gesamte Sequenz der menschlichen DNA bereits bekannt ist. Wahrscheinlich ist eine große Gruppe von Genen bis dato weitestgehend unentdeckt geblieben, weil sie nicht für Proteine kodieren. Viele der bekannten, nicht kodierenden RNA-Moleküle spielen eine Schlüsselrolle in der Biochemie der Zelle. Beispiele sind: Transfer-RNAs, ribosomale RNAs, tmRNA, die RNA-Komponenten der RNase P sowie der Signalrezeption (SRP RNA). Eine weitere Ebene der RNA-Funktion stellen strukturelle Motive innerhalb Protein- kodierender Gene dar, die meist in den nicht-translatierten 5`- oder 3`-Regionen von prä-mRNA (unprozessiert) lokalisiert sind. Es lässt sich somit argumentieren, dass "RNomics", d. h. das Verständnis funktionaler RNAs und deren Wechselwirkungen auf genomischer Ebene, von höchster praktischer und theoretischer Bedeutung für moderne Biowissenschaften sind: Umfassendes Verständnis für die Biologie einer Zelle erfordert jedenfalls das Wissen um die Existenz aller funktionalen RNAs und ihrer Wechselwirkungspartner auf molekularer Ebene sowie die molekularen Strukturen all dieser Komplexe. Der erste Schritt in diese Richtung ist die Entwicklung vielseitiger und verlässlicher Algorithmen und datenverarbeitender Routinen, die funktionale RNAs detektieren und klassifizieren können. Vorzugsweise sollte man mit einem einzigen Genom das Auslangen finden oder, falls sich dies als unmöglich erweist, mit einer sehr kleinen Zahl verwandter Genome. Unser Ziel ist die Entwicklung bioinformatischer Methoden, die spezifisch auf die Detektion, Verifikation und Klassifikation funktionaler RNAs zugeschnitten sind. Unser Ansatz in Richtung "Computational RNomics" beinhaltet: * verbesserte Algorithmen zur Vorhersage von Sekundärstrukturen in RNA * verbesserte Alignment-Algorithmen für Nukleinsäuresequenzen * neue Ansätze für den Vergleich und das Alignment von RNA-Strukturen * Erweiterungen existierender RNA-Algorithmen, um Datensätze in Genomgröße handhaben zu können * ein Datenbank-System, dass speziell auf RNA-Strukturen ausgerichtet ist.
RNomik steht für den holistischen Ansatz, die Gesamtheit aller RNAs in einem Organismus zu betrachten. Vorhersage, Detektion und Klassifizierung dieser RNAs bedarf der Implementierung vergleichender Methoden zur Identiffizierung von Ähnlichkeiten zwischen unbekannten und bekannten RNA Species. In Fall von DNA, Klassifizierung erfolgt einfach via Sequenzvergleich. Protein wiederum benötigen zusätzliche Schritte aufgrund der für ihre Funktion wichtigen 3D Struktur. Die Funktion von RNAs wird nur durch zwei Eigenschaften festgelegt: die Sequenz, die in eine Sekundärstruktur falted. Diese Faltung folgt wohldefinierten Regeln, nur drei Arten von Basenpaaren sind dabei erlaubt: A-U, G-C, G-U. Programme wie RNAfold oder Mfold berechnen solche Sekundärstrukturen beginnend ausgehend von einer Einzelsequenz. Vergleicht man ein RNA Gen von unterschiedlichen Organismen, so werden sich die Sequenzen unterscheiden, die Structuren aber sehr ähnlich sein. Diese Beobachtung resultiert aus kompensatorischen Mutationen, Sequenzänderungen, die die Bildung eines Basenpaars weiterhin ermöglichen. Nur jene Basenpaare innerhalb einer funktionellen Struktur stehen unter solch erhöhtem Selektionsdruck. Kompensatorische Mutationen erlauben uns also, in ihrer Sequenz ähnliche RNAs zu klassifizieren. Ziel dieses Projekts war die Entwicklung einer Vielzahl von Tools zur Suche von RNA Genen. Wir konnten zu allen Fragestellungen im Projektantrag Lösungsansätze finden, sie an ausgewählten Modellorganismen (Viren, Bakterien und Tieren) testen und somit die generelle Anwendbarkeit unserer RNA Tools zeigen. Wir entwickelten zwei Algorithmen zum alignieren von RNA Sequenzen, die Proteincodierung (codaln) und Sekundärstrukturinformation (pmmulti) berücksichtigen. Die Programme hxmatch und alidot verwenden unterschiedliche Methoden zur Vorhersage von konservierten Sekundärstrukturen aus Alignments, inklusive rechnerisch aufwendiger Pseudoknoten. Sowohl Alifoldz, wie auch RNAz verfolgen den vergleichenden Ansatz und representieren Methoden für genomweite Studien in Eukaryonten Genomen. Die Handhabung solch großer Datenmengen bedarf bedarf eienr speziell designten MySQL Datenbank. RNALfold, eine Variante von RNAfold, dient zur Vorhersage lokaler RNA Strukturen und ist ebenso anwendbar auf ganze Genome. Zusätzlich zu den gesteckten Zielen entwickelten wir Methoden zum design bistabiler RNAs, den sogenannten `RNA switches`, und `modifier RNAs`, welche die Bildung funktioneller RNA Strukturen verhindern können. Die molekulare Evolution einer Gruppe von microRNAs, kleine, natürlich vorkommende nicht codierende RNAs, wurde rekonstruiert basierend auf Sequenzen, die mit Hilfe der im Zuge dieses Projekts entwickelten Tool identiffiziert werden konnten.
- Universität Wien - 100%
- Robert Giegerich, Universität Bielefeld - Deutschland
Research Output
- 2779 Zitationen
- 16 Publikationen
-
2006
Titel The expansion of the metazoan microRNA repertoire DOI 10.1186/1471-2164-7-25 Typ Journal Article Autor Hertel J Journal BMC Genomics Seiten 25 Link Publikation -
2006
Titel Algebraic comparison of metabolic networks, phylogenetic inference, and metabolic innovation DOI 10.1186/1471-2105-7-67 Typ Journal Article Autor Forst C Journal BMC Bioinformatics Seiten 67 Link Publikation -
2006
Titel Memory efficient folding algorithms for circular RNA secondary structures DOI 10.1093/bioinformatics/btl023 Typ Journal Article Autor Hofacker I Journal Bioinformatics Seiten 1172-1176 Link Publikation -
2006
Titel Thermodynamics of RNA–RNA binding DOI 10.1093/bioinformatics/btl024 Typ Journal Article Autor Mückstein U Journal Bioinformatics Seiten 1177-1182 Link Publikation -
2005
Titel Fast and reliable prediction of noncoding RNAs DOI 10.1073/pnas.0409169102 Typ Journal Article Autor Washietl S Journal Proceedings of the National Academy of Sciences Seiten 2454-2459 Link Publikation -
2005
Titel Mapping of conserved RNA secondary structures predicts thousands of functional noncoding RNAs in the human genome DOI 10.1038/nbt1144 Typ Journal Article Autor Washietl S Journal Nature Biotechnology Seiten 1383-1390 -
2005
Titel The effect of RNA secondary structures on RNA-ligand binding and the modifier RNA mechanism: a quantitative model DOI 10.1016/j.gene.2004.11.043 Typ Journal Article Autor Hackermüller J Journal Gene Seiten 3-12 Link Publikation -
2005
Titel Unorthodox mRNA start site to extend the highly structured leader of retrotransposon Tto1 mRNA increases transposition rate DOI 10.1261/rna.2640105 Typ Journal Article Autor Böhmdorfer G Journal RNA Seiten 1181-1191 Link Publikation -
2005
Titel Multiple sequence alignments of partially coding nucleic acid sequences DOI 10.1186/1471-2105-6-160 Typ Journal Article Autor Stocsits R Journal BMC Bioinformatics Seiten 160 Link Publikation -
2004
Titel Structural and evolutionary analysis of the transcribed sequence of Boudicca, a Schistosoma mansoni retrotransposon DOI 10.1016/j.gene.2003.12.023 Typ Journal Article Autor Copeland C Journal Gene Seiten 103-114 Link Publikation -
2004
Titel Bichir HoxA Cluster Sequence Reveals Surprising Trends in Ray-Finned Fish Genomic Evolution DOI 10.1101/gr.1712904 Typ Journal Article Autor Chiu C Journal Genome Research Seiten 11-17 Link Publikation -
2004
Titel Comparative Genomics, cis-Regulatory Elements, and Gene Duplication DOI 10.1016/s0091-679x(04)77029-6 Typ Book Chapter Autor Force A Verlag Elsevier Seiten 545-561 -
2004
Titel Consensus Folding of Aligned Sequences as a New Measure for the Detection of Functional RNAs by Comparative Genomics DOI 10.1016/j.jmb.2004.07.018 Typ Journal Article Autor Washietl S Journal Journal of Molecular Biology Seiten 19-30 Link Publikation -
2004
Titel Prediction of Consensus RNA Secondary Structures Including Pseudoknots DOI 10.1109/tcbb.2004.22 Typ Journal Article Autor Witwer C Journal IEEE Transactions on Computational Biology and Bioinformatics Seiten 66-77 Link Publikation -
2004
Titel Efficient computation of RNA folding dynamics DOI 10.1088/0305-4470/37/17/005 Typ Journal Article Autor Wolfinger M Journal Journal of Physics A: Mathematical and General Seiten 4731 -
2004
Titel Molecular Evolution of a MicroRNA Cluster DOI 10.1016/j.jmb.2004.03.065 Typ Journal Article Autor Tanzer A Journal Journal of Molecular Biology Seiten 327-335 Link Publikation