Protein-Faltungserkennung
Protein fold recognition
Wissenschaftsdisziplinen
Biologie (100%)
Keywords
-
PROTEIN FOLDING,
PROTEIN STRUCTURE PREDICTION,
STRUCTURAL GENOMICS,
GENOM PROJECTS,
C.ELEGANS
Mit Ende des vergangenen Jahres ist es gelungen die Sequenzierung des C.elegans Genoms zu vollenden. Damit steht das erste vollständige Genom eines vielzelligen Organismus zur Verfügung. Nach dem derzeitigen Stand der Analyse enthält das Genom 19,100 protein-kodierende Regionen. In wenigen Jahren wird die Zahl bekannter Proteinsequenzen in Millionenhöhe liegen. Die Interpretation dieser Sequen-zeninformation erfordert die Bestimmung der Raumstruktur der Proteinprodukte und die Zuordnung ihrer biologischer Funktionen. Die experimentelle Erforschung der Raumstruktur aller Proteine ist unmöglich. Dagegen erscheint ein kombinierter Ansatz von experimenteller Strukturbestimmung und theoretischer Methoden erfolgversprechend. Zur Zeit trifft die "structural genomics community" Vorbereitungen, einen repräsentativen Datensatz zu bestimmen, der die Strukturen aller biologischen Proteine umfaßt. Alle anderen Strukturen könnten dann auf der Basis dieses Datensatzes durch rechnergestützte Methoden modelliert werden. Die Zahl individueller Faltungen wird auf etwa 10,000 geschätzt. Das Ziel, mindestens einen Vertreter jeder Faltungsklasse zu bestimmen, scheint innerhalb von fünf bis zehn Jahren erreichbar, wobei es darauf ankommt redundante Strukturbestimmungen, die zur Aufklärung ähnlicher Faltungen führen, zu vermeiden. Faltungserkennung ist eine neue Technik, die einerseits dieses Unterfangen wesentlich unterstützen und andererseits zur Modellierung von Strukuren verwendet werden kann. Mit ihrer Hilfe können strukturelle Relationen zwischen Proteinen entdeckt werden, auch wenn keine Ähnlichkeiten in den Sequenzen feststellbar sind. Faltungserkennung kann dazu beitragen, redundante Strukturbestimmungen zu vermeiden und damit die Bestimmung einer repräsentativen Strukturdatenbank zu beschleunigen. Das kürzlich beendete CASP Experiment (Critical Assessment of Techniques for Protein Structure Prediction) zeigt, daß Faltungserkennung für diese Aufgabe prinzipiell geeignet ist. Ziel des vorliegenden Projekts ist die Entwicklung eines Testsystems für Faltungserkennung und seine Verwendung in der Qualitätskontrolle und Zuverlässigkeitsanalyse. Im Besonderen wird das Testsystem verwendet Faltungserkennung zu automatisieren um Anwendungen, die hohen Durchsatz erfordern, zu ermöglichen. Die optimierte Version wird im nächsten CASP-Experiment im Jahr 2000 erneut getestet und zur strukturellen Analyse des C.elegans Genoms eingesetzt werden. Die Analyse führt zur Implementation einer C.elegans Datenbank, welche die gesamte Strukturinformation der C.elegans Proteine enthält, zusammen mit Informationen über biologische Funktionen, die über das Internet zugänglich sind. Die Datenbank ermöglicht schnell festzustellen für welche Proteine keine direkten (Sequenzhomologie) und indirekten (Faltungserkennung) Strukturinformationen vorhanden sind. Diese Proteine sind interessante Ziele für die Strukturbestimmung (structural genomics). Ein der Hauptziel der Molekularen Biologie ist die Bereitstellung der Struktur und biologischen Funktion aller menschlichen Proteinen. Die Faltungserkennung ist ein hilfreiches Werkzeuge dieses Ziel zu erreichen und die gesammelten Informationen zu nutzen. Die Arbeiten am C.elegans Genom im Zuge dieses Projekts bilden daher auch ein Modell für die Datenerfassung des menschlichen Genoms, das voraussichtlich in drei bis fünf Jahren vollendet sein wird.
Die biologische Forschung hat in den letzten Jahren durch die Sequenzierung der Genome hochentwickelter Organismen enorme Erfolge erzielt. Insbesondere werden von der Entschlüsselung des menschlichen Genoms entscheidende Fortschritte für die medizinische Forschung erwartet. Das Ergebnis der Sequenzierung der DNA eines Genoms ist die Reihenfolge der Nukleotide entlang der Chromosomen. Im Prinzip enthält diese Sequenz den `Bauplan` des jeweiligen Organismus, allerdings in einer Form, die erst entschlüsselt werden muss. Der erste Schritt ist die Identifizierung jener Abschnitte der DNA Sequenz, welche den Bauplan für Proteine bereitstellen und die Charakterisierung dieser Genprodukte. Dieser Prozess der `Genom-Annotation` liefert Informationen über die Funktionen der einzelnen Gene und Proteine und deren Zusammenspiel im Organismus. Die Annotation der Genome ist eine der wichtigsten Aufgaben der Bioinformatik. Die Bioinformatik stellt Computer-gestützte Werkzeugen zur Verfügung die im wesentlichen die enorme Redundanz in der biologischen Welt nutzen. Neue Gensequenzen werden mit Datenbanken bereits annotierter Sequenzen verglichen. Sofern signifikante Ähnlichkeiten gefunden werden können Rückschluesse auf die Funktion des Gens, bzw. des Proteins getroffen werden. In diesem Projekt wurde ein Annotations-System entwickelt, das ein Arsenal von bewährten und neuen Suchverfahren integriert, Daten aus den verschiedenen öffentlichen Datenbanken zusammenführt und die Struktur und Funktion der Proteine eines Genoms automatisch und zuverlässig charakterisiert. Die aktuelle Version ist über das world wide web zugänglich (www.came.sbg.ac.at) und enthält die eukaryotischen Genome des Menschen (homo sapiens), der Maus (mus musculus), des Fadenwurms (caenorhabditis elegans) und der Senfpflanz (arabidopsis thaliania). Untersucht werden dabei insbesonders Eigenschaften der Sequenz, Struktur und Funktion der Protein sowie deren Lokalisation in der Zelle. Die besondere Stärke dieser Annotation des Genoms wird insbesonders durch die in Vorprojekten entwickelten Verfahren zur Faltungserkennung erreicht. Diese Technik liefert Modelle der räumlichen Struktur von Proteinen, welche für das Verständis ihrer Wirkungsweise und biologischen Funktion unerlässlich ist. Alle aktuellen Resultate sind in einer Datenbank zusammengefasst, wodurch die Abfrage und Kombination verschiedenster Informationen und auch eine globale Betrachtung der Genome erreicht wird. Die aktuelle Version identifiziert 29.000 menschliche Proteine, die mit Proteinen bekannter Annotation in Beziehung stehen. Dies sind 44% der insgesamt 65.000 bekannten Gene des Menschen. Das Annotationssystem ermöglicht die schnelle und sichere Abwicklung komplexer Forschungsprojekte und wird derzeit in mehreren Kollaborationen eingesetzt. In einem Projekt mit Intercell (Wien) und ProCeryon (Salzburg) wurden einige hundert Proteine aus pathogenen Bakterien entdeckt, welche das menschliche Immunsystem zur Bildung von Antikörpern anregen. Mit Hilfe der Annotationsplatform und insbesondere der Fold-Recognition Technik wurde die Struktur und Funktion dieser Proteine charakterisiert und einige `Targets` identifiziert, welche für die Entwicklung von Antibiotika geeignet sind.
- Universität Salzburg - 100%
Research Output
- 5082 Zitationen
- 8 Publikationen
-
2007
Titel QSCOP-BLAST—fast retrieval of quantified structural information for protein sequences of unknown structure DOI 10.1093/nar/gkm264 Typ Journal Article Autor Suhrer S Journal Nucleic Acids Research Link Publikation -
2007
Titel NQ-Flipper: recognition and correction of erroneous asparagine and glutamine side-chain rotamers in protein structures DOI 10.1093/nar/gkm263 Typ Journal Article Autor Weichenberger C Journal Nucleic Acids Research Link Publikation -
2007
Titel ProSA-web: interactive web service for the recognition of errors in three-dimensional structures of proteins DOI 10.1093/nar/gkm290 Typ Journal Article Autor Wiederstein M Journal Nucleic Acids Research Link Publikation -
2006
Titel QSCOP—SCOP quantified by structural relationships DOI 10.1093/bioinformatics/btl594 Typ Journal Article Autor Suhrer S Journal Bioinformatics Seiten 513-514 Link Publikation -
2004
Titel Protein Sequence Randomization: Efficient Estimation of Protein Stability Using Knowledge-based Potentials DOI 10.1016/j.jmb.2004.11.012 Typ Journal Article Autor Wiederstein M Journal Journal of Molecular Biology Seiten 1199-1212 -
2001
Titel Assessment of the CASP4 fold recognition category DOI 10.1002/prot.10006 Typ Journal Article Autor Sippl M Journal Proteins: Structure, Function, and Bioinformatics Seiten 55-67 -
2000
Titel The role of protein structure in genomics DOI 10.1016/s0014-5793(00)01678-1 Typ Journal Article Autor Domingues F Journal FEBS Letters Seiten 98-102 -
2000
Titel Structure-derived substitution matrices for alignment of distantly related sequences DOI 10.1093/protein/13.8.545 Typ Journal Article Autor Prlic A Journal Protein Engineering Seiten 545-550 Link Publikation