Lange nich-kodierende RNAs in eukaryotischen Genomen
Long noncoding RNAs in eukaryotic gemomes
Wissenschaftsdisziplinen
Biologie (100%)
Keywords
-
Noncoding RNAs,
Comperative Genomics,
Genome evolution,
Chromatin modifications,
Genome annotation,
RNA secondary structure
Nicht kodierende RNAs (noncoding RNAs, ncRNAs) sind Trankripte, die im Gegensatz zu mRNAs nicht in Proteine übersetzt werden sondern ihre Funktion auf RNA Ebene ausüben. In den letzten Jahren wurde immer deutlicher, dass diese "RNA Gene" weit häufiger sind als bisher angenommen. Insbesondere die Entdeckung der microRNAs (miRNA) hat unser Verständnis von Gen-Regulation grundlegend verändert. Neueste Ergebnisse zeigen jedoch, dass es tausende ncRNAs gibt, die nicht der Klasse der miRNAs zuzuordnen sind. Hochdurchsatzexperimente brachten viele gespleißte und polyadenylierte nicht-kodierende Transkripte von mehreren Kilobasen Länge zum Vorschein. Die Rolle dieser mRNA ähnlichen "langen" ncRNAs ist zum Großteil noch völlig unklar. Die wenigen im Detail beschriebenen Beispiele zeigen jedoch, dass ncRNAs für überraschend viele unterschiedlichen Funktionen wie (post-)transkriptionale Regulation, Chromatin-Modifikation, Zell- Proliferation und Entwicklung wichtig sind. Das Ziel dieses Projekts ist mit Hilfe computerunterstützter und experimenteller Methoden die Rolle dieser rätselhaften RNAs besser zu verstehen. In einem ersten Schritt werden existierende Methoden zur Annotierung von ncRNAs verbessert und neue entwickelt. Algorithmen zur Vorhersage von RNA-Strukturen, die sich als besonders aussichtsreich zur ncRNA Annotierung erwiesen haben, werden erweitert und an die mittlerweile vorhandenen großen Datensätze mit dutzenden von homologen Genomen angepasst. Dadurch ergeben sich nicht nur verbesserte Genauigkeit, sondern auch neue Möglichkeiten wie z.B. die Analyse von linien-spezifischen Strukturen. Als Alternative zu strukturbasierten Ansätzen werden auch reine Sequenzeigenschaften von ncRNAs untersucht. Insbesondere werden wir bisher nicht beachtete evolutionäre Signaturen wie `Ultrakonservierungseffekte`, Assymetrien in Mutationsraten und Ratenheterogenität im Zusammenhang mit RNAs untersuchen. Als Ergänzung und Unterstützung dieser rein bioinformatischen Methoden, werden genomweite Datensätze aus Hochdurchsatzexperimenten mit einbezogen. Im Gegensatz zu früheren "Transcriptomics" Studien, konzentriert sich das vorliegende Projekt auf einen konzeptionell neuen Ansatz, Transkripte indirekt anhand von Histonmodifikationsmustern zu identifizieren. Mittels dieser Methoden wird ein qualitativ hochwertiger Satz an Kandidaten erstellt, der in weiterer Folge mit theoretischen und (in Zusammenarbeit mit experimentellen Gruppen) empirischen Methoden analysiert wird. Kandidaten werden basierend auf lokalen Sequenz-/Strukturmustern in der RNA, cis-regulatorischen Regionen auf Ebene der DNA und möglicher RNA/RNA und RNA/DNA Interaktionspartner klassifiziert. Darüber hinaus werden das Proteinkodierungspotential und das Verhältnis zu benachbarten und überlappenden Protein-Genen statistisch analysiert. Auf experimenteller Seite wird die genaue Struktur der Transkripte mittels PCR basierender Methoden und neuartiger Sequenziermethoden ermittelt. Um Aussagen über mögliche Funktionen der ncRNA Kandidaten machen zu können, werden Microarray Chips gefertigt und die gewebs- und umweltspezifischen Expressionsmuster sowie Co-Expression und Co-Regulation mit bekannten Protein-Genen analysiert. Die Kombination von etablierten bioinformatischen und experimentellen Methoden mit konzeptionell neuen Ideen und Techniken wird dazu beitragen die genomische Organisation, Evolution und letztendlich die Funktionen dieser immer noch weitgehend ignorierten Klasse von langen RNA Genen besser zu verstehen.