Basen-modifizierte RNA Sequenzen für Nanopore Sequenzierung
Large libraries of base-modified RNA for Nanopore sequencing
Wissenschaftsdisziplinen
Chemie (70%); Informatik (10%); Nanotechnologie (20%)
Keywords
-
Microarray Photolithography,
Nucleic Acid Chemistry,
RNA synthesis,
RNA base modifications,
Nanopore sequencing,
Neural Network Training
RNA ist das Bindeglied zwischen der genetischen Information (gespeichert in DNA) und dem Produkt der Genexpression (Proteinen) und ist, wie auch DNA, eine Nukleinsäure, ein Biopolymer, das aus vier verschiedenen Bausteinen oder Basen (A, C, G und U) besteht, die in einer ganz bestimmten Reihenfolge, der sogenannten Sequenz, miteinander verbunden sind. Jedoch offenbart sich zunehmend, dass RNA auch eine reiche Vielfalt anderer Basen enthält, die sehr unterschiedliche Rollen im zellulären Umfeld einnehmen. Die Identifizierung von Basen, die über das genetische Standardalphabet hinausgehen, ist der einzige Weg, mit dem Wissenschaftler die RNA-Welt erforschen können. Aber dies ist ein schwieriges Unterfangen, arbeitsintensiv und mit sehr geringem Durchsatz. Vor kurzem wurde eine neue Technik zur Sequenzierung von Nukleinsäuren entwickelt, die sogenannte Nanopore-Sequenzierung, welche RNA direkt lesen und die Sequenz ermitteln kann. Sie hat das Potenzial, eine sehr große Bandbreite biologisch relevanter Basenmodifikationen zu identifizieren. Doch um das zu realisieren, müssen Software und Programme, die zur Identifizierung von RNA-Basen verwendet werden, darauf trainiert werden, neue Elemente zu erkennen. Dieses Computertraining sorgfältig und effizient umzusetzen, erfordert die Herstellung komplexer Sets von RNA-Sequenzen, die bestimmte Basenmodifikationen enthalten. Der einzige synthetische Ansatz, der große Mengen einzigartiger RNA-Sequenzen mit sehr hohem Durchsatz liefern kann, ist die Synthese von Microarrays. Dabei werden Hunderttausende von Nukleinsäuresequenzen parallel auf einer einzigen Plattform hergestellt, wobei jede Sequenz an einer exakt definierten Position der Glasoberfläche lokalisiert ist. In unserem Labor verwenden wir UV-Licht, um die Synthese von DNA- und RNA-Sequenzen in einem Prozess namens Photolithographie zu steuern. In diesem Projekt planen wir, vier neue RNA-Basen, die in der Natur vorkommen, mithilfe der Microarray-Photolithographie in die RNA-Sequenzen einzubauen: m6A, m5C, Inosin und Pseudouridin. Unser Plan sieht vor, die neuen Basen mit hoher Präzision in alle möglichen Sequenzkontexte einzuführen, um Computeralgorithmen beizubringen, eine neue Base unabhängig von ihrer benachbarten chemischen Umgebung eindeutig zu erkennen. Zu diesem Zweck werden wir spezielle RNA-Bausteine (Phosphoramidite) verwenden, die jeder der vier neuen RNA-Basen entsprechen. Anschließend führen wir die Sequenzierung der RNA-Bibliotheken durch, beginnend mit unmodifizierter RNA und schrittweiser Erhöhung der Sequenzkomplexität mit bis zu vier Basenmodifikationen gemischt mit A, C, G und U aus dem genetischen Standardalphabet. Sequenzierung und Datenanalyse werden von Kooperationspartnern am Center for Genomic Science des Italian Institute of Technology in Mailand durchgeführt. Mit der Möglichkeit zur Identifizierung von acht verschiedenen RNA-Basen in einem einzigen Experiment, werden diese trainierten Algorithmen und Programme, die zur Analyse der Sequenzierungsläufe verwendet werden, der Bioinformatik-Community frei zur Verfügung stehen und weitgehend auf alle Experimente zur Nanopore-RNA-Sequenzierung anwendbar sein. Im Gegenzug wird die Sequenzierung Aufschluss über die Genauigkeit und Zuverlässigkeit der chemischen Synthese von RNA durch Microarray- Photolithographie geben, insbesondere über die Insertions-, Deletions- und Substitutionsraten. Dies ist für die Verbesserung und Optimierung unserer Syntheseprotokolle von entscheidender Bedeutung, um die relevanten Fehlerquellen zu erkennen und aus ihnen zu lernen.
Das Forschungsprojekt hat es uns ermöglicht, wichtige Erkenntnisse über die Chemie der DNA-Fotolithografie zu gewinnen und bedeutende Fortschritte bei der Verbesserung der Qualität komplexer DNA-Sequenzbibliotheken zu erzielen. Noch wichtiger ist jedoch, dass das Projekt die Entwicklung komplexer RNA-Sequenzbibliotheken ermöglicht hat, was einzigartig ist, und deren Sequenzlängen unsere bisherigen Grenzen überschritten haben. Ausgehend von einer begrenzten Länge von 30 nt können wir nun RNA-Oligonukleotide mit einer Länge von 100 nt und hoher Qualität herstellen, and dafür können wir nun zwei neue Sätze von RNA-Nukleotiden verwenden. Im Rahmen des Projekts haben wir auch die Chemie zur Synthese modifizierter RNA-Nukleotide entwickelt. Diese Modifikationen kommen in der Natur auf DNA und RNA vor, und wir beginnen gerade erst, die Rolle und Funktion dieser Modifikationen aufzudecken. Mit unserem Syntheseansatz können wir nun RNA-Bibliotheken erstellen, die diese biologisch relevanten Modifikationen enthalten. Ein wichtiger Meilenstein des Projekts war die Sicherung einer fruchtbaren Zusammenarbeit mit Oxford Nanopore Technologies, dem Hersteller der leistungsstarken Sequenzierungstechnik der dritten Generation namens Nanopore-Sequenzierung. Das Forschungs- und Entwicklungsteam von ONT konnte unsere RNA-Bibliotheken sequenzieren, was einen direkten Beweis für die Qualität und Genauigkeit unserer synthetischen RNA liefert. ONT war auch in der Lage, die in die RNA-Bibliotheken integrierten Basenmodifikationen zu sequenzieren. Nachdem nun der Nachweis des Prinzips erbracht ist, wird die Zusammenarbeit fortgesetzt und sich auf die komplexere Sequenzierung synthetischer RNA mit höherem Durchsatz konzentrieren. Dieses Projekt war für die Entwicklung der Chemie der RNA-Fotolithografie von grundlegender Bedeutung. Zwar konnten nicht alle Ziele innerhalb der Projektlaufzeit erreicht werden, doch werden die Arbeiten als direkte Fortsetzung dieses Projekts weitergeführt.
- Universität Wien - 100%
- Tommaso Leonardi, Italian Institute of Technology - Italien
- Adrien Léger, EMBL Outstation Hinxton - Vereinigtes Königreich
Research Output
- 43 Zitationen
- 9 Publikationen
- 10 Datasets & Models
-
2024
Titel Accelerated, high-quality photolithographic synthesis of RNA microarrays in situ. DOI 10.1126/sciadv.ado6762 Typ Journal Article Autor Kekić T Journal Science advances -
2024
Titel Nonaqueous Oxidation in DNA Microarray Synthesis Improves the Oligonucleotide Quality and Preserves Surface Integrity on Gold and Indium Tin Oxide Substrates. DOI 10.1021/acs.analchem.3c04166 Typ Journal Article Autor Ibañez-Redín G Journal Analytical chemistry Seiten 2378-2386 -
2022
Titel Sequence-dependent quenching of fluorescein fluorescence on single-stranded and double-stranded DNA DOI 10.1039/d2ra00534d Typ Journal Article Autor Lietard J Journal RSC Advances Seiten 5629-5637 Link Publikation -
2023
Titel Enzymatic Synthesis of High-Density RNA Microarrays. DOI 10.1002/cpz1.667 Typ Journal Article Autor Lietard J Journal Current protocols -
2022
Titel Simple synthesis of massively parallel RNA microarrays via enzymatic conversion from DNA microarrays DOI 10.1038/s41467-022-31370-9 Typ Journal Article Autor Schaudy E Journal Nature Communications Seiten 3772 Link Publikation -
2022
Titel Sequence-dependence of Cy3 and Cy5 dyes in 3' terminally-labeled single-stranded DNA DOI 10.1038/s41598-022-19069-9 Typ Journal Article Autor Kekic T Journal Scientific Reports Seiten 14803 Link Publikation -
2023
Titel Dipodal Silanes Greatly Stabilize Glass Surface Functionalization for DNA Microarray Synthesis and High-Throughput Biological Assays. DOI 10.1021/acs.analchem.3c03399 Typ Journal Article Autor Das A Journal Analytical chemistry Seiten 15384-15393 -
2022
Titel An 8-bit monochrome palette of fluorescent nucleic acid sequences for DNA-based painting DOI 10.1039/d2nr05269e Typ Journal Article Autor Kekic T Journal Nanoscale Seiten 17528-17533 Link Publikation -
2023
Titel A Canvas of Spatially Arranged DNA Strands that Can Produce 24-bit Color Depth. DOI 10.1021/jacs.3c06500 Typ Journal Article Autor Kekić T Journal Journal of the American Chemical Society Seiten 22293-22297
-
2026
Link
Titel Cy3 sequence depende DOI 10.5281/zenodo.18305034 Typ Database/Collection of data Öffentlich zugänglich Link Link -
2026
Link
Titel CSO and gold slides DOI 10.5281/zenodo.18310386 Typ Database/Collection of data Öffentlich zugänglich Link Link -
2026
Link
Titel Cy3 sequence depende DOI 10.5281/zenodo.18305035 Typ Database/Collection of data Öffentlich zugänglich Link Link -
2026
Link
Titel Enzymatic DNA synthesis DOI 10.5281/zenodo.18312475 Typ Database/Collection of data Öffentlich zugänglich Link Link -
2026
Link
Titel QR scans DOI 10.5281/zenodo.18310212 Typ Database/Collection of data Öffentlich zugänglich Link Link -
2026
Link
Titel PrOM RNA DOI 10.5281/zenodo.18304823 Typ Database/Collection of data Öffentlich zugänglich Link Link -
2026
Link
Titel PrOM RNA DOI 10.5281/zenodo.18304822 Typ Database/Collection of data Öffentlich zugänglich Link Link -
2026
Link
Titel Greenscale DOI 10.5281/zenodo.18304639 Typ Database/Collection of data Öffentlich zugänglich Link Link -
2023
Titel RGB output DOI 10.5281/zenodo.8395197 Typ Database/Collection of data Öffentlich zugänglich -
2022
Titel Fluorescein sequence dependence DOI 10.5281/zenodo.18305080 Typ Database/Collection of data Öffentlich zugänglich