Computergestützte Entwicklung von Multi-Enzym Netzwerken
Computer-aided design of multi-enzyme networks
Wissenschaftsdisziplinen
Biologie (50%); Informatik (30%); Mathematik (20%)
Keywords
-
Graph Theory,
Machine learning,
Biocatalysis,
Multi-Enzyme Networks,
Cheminformatics,
Retrosynthesis
Die Verwendung von Enzymen in der Herstellung von Chemikalien erfreut sich seit einigen Jahren immer größerer Beliebtheit, und stellt eine umweltfreundliche Alternative zu herkömmlichen Synthesewegen dar. Das Projekt setzte sich daher zum Ziel eine vermehrte Anwendung von enzymatischen Reaktionen zu ermöglichen, indem eine computer-gestützte Vorhersage und Modellierung der Reaktivität von verschiedenen Enzymen, deren mögliche Substrate und enzymatische Synthesewege von vorgegebenen Stoffen erforscht und entwickelt wird. Hierzu wurde ein umfangreicher Datensatz an enzymatischen Reaktionen aus bestehender Fachliteratur extrahiert, der nun die Grundlage für viele heuristische Modelle und maschinelles Lernen von enzymatischer Reaktivität bildet. Diese Arbeit ermöglichte zum ersten Mal eine präzise Vorhersage von enzymatischen Reaktionen für viele Arten von Enzymen und Reaktionen, und bewies so dass enzymatische Reaktionen und Synthesewegen aus solchen Reaktionen am Computer tatsächlich genau vorgesagt werden können. Die Modelle für solche Vorhersagen basierten hierbei hauptsächlich auf dem Konzept des Maschinellen Lernens, wofür im Zuge des Projekts neue Repräsentationen für Reaktionen und Modell-Architekturen entwickelt wurden. Hierfür wurden Graph-basierte Modelle, also Modelle in denen Moleküle als Graphen (ein Satz an Eckpunkten für jedes Atom, und Kanten zwischen den Eckpunkten für jede Bindung zwischen Atomen), auf Reaktionen erweitert. Auf diese Weise wurden Graph-basierte neuronale Netze, eine Art von maschinellem Lernen bei dem Eigenschaften von Molekülen von der lokalen Information im Molekül-Graph gelernt werden, für enzymatische Reaktionen anwendbar, und ermöglichten so die Vorhersage der Reaktivität und Selektivität von Enzymen. Weiters wurden bestehende Ansätze für die computer-gestützte Retrosynthese, also der Aufgabe einem Computer beizubringen mögliche Synthesewege für eine gegebene Chemikalie zu finden, auf enzymatische Reaktionen erweitert. Zusammen mit der oben beschriebenen Datenbank konnte so präzise Modelle für enzymatische Synthesewege entwickelt werden. Weitere Arbeiten erforschten zudem die Quantifizierung von Fehlern und Unsicherheiten in solchen Modellen, um den Nutzer eines solchen Modells über unsichere und daher möglicherweise fehlerhafte Vorhersagen informieren zu können. Insgesamt ermöglichte das Projekt daher eine Daten-basierte, genaue Vorhersage von enzymatischen Reaktionen am Computer, und konnte so dieses wichtige Forschungsfeld vorantreiben, nämlich mithilfe maschinellem Lernen eine umweltfreundlichere and nachhaltigere chemische Synthese zu ermöglichen.
- Andrew Griffiths, ESPCI ParisTech - Frankreich
Research Output
- 285 Zitationen
- 30 Publikationen
- 9 Datasets & Models
- 3 Wissenschaftliche Auszeichnungen
-
2021
Titel Machine learning of reaction properties via learned representations of the condensed graph of reaction DOI 10.33774/chemrxiv-2021-frfhz Typ Preprint Autor Heid E Link Publikation -
2021
Titel Regio-selectivity prediction with a machine-learned reaction representation and on-the-fly quantum mechanical descriptors DOI 10.1039/d0sc04823b Typ Journal Article Autor Guan Y Journal Chemical Science Seiten 2198-2208 Link Publikation -
2022
Titel On the Value of Using 3D Shape and Electrostatic Similarities in Deep Generative Methods DOI 10.1021/acs.jcim.1c01535 Typ Journal Article Autor Bolcato G Journal Journal of Chemical Information and Modeling Seiten 1388-1398 Link Publikation -
2022
Titel On the value of using 3D-shape and electrostatic similarities in deep generative methods DOI 10.26434/chemrxiv-2021-sqvv9-v3 Typ Preprint Autor Bolcato G Link Publikation -
2021
Titel Influence of Template Size, Canonicalization, and Exclusivity for Retrosynthesis and Reaction Prediction Applications DOI 10.1021/acs.jcim.1c01192 Typ Journal Article Autor Heid E Journal Journal of Chemical Information and Modeling Seiten 16-26 Link Publikation -
2021
Titel Machine Learning of Reaction Properties via Learned Representations of the Condensed Graph of Reaction DOI 10.1021/acs.jcim.1c00975 Typ Journal Article Autor Heid E Journal Journal of Chemical Information and Modeling Seiten 2101-2110 Link Publikation -
2021
Titel Machine Learning of Reaction Properties via Learned Representations of the Condensed Graph of Reaction DOI 10.33774/chemrxiv-2021-frfhz-v2 Typ Preprint Autor Heid E Link Publikation -
2022
Titel Machine-Learning-Guided Discovery of Electrochemical Reactions DOI 10.1021/jacs.2c08997 Typ Journal Article Autor Zahrt A Journal Journal of the American Chemical Society Seiten 22599-22610 Link Publikation -
2021
Titel EHreact: Extended Hasse Diagrams for the Extraction and Scoring of Enzymatic Reaction Templates DOI 10.26434/chemrxiv.14714748.v1 Typ Preprint Autor Heid E Link Publikation -
2021
Titel EHreact: Extended Hasse Diagrams for the Extraction and Scoring of Enzymatic Reaction Templates DOI 10.33774/chemrxiv-2021-jxxbh-v2 Typ Preprint Autor Heid E Link Publikation -
2021
Titel EHreact: Extended Hasse Diagrams for the Extraction and Scoring of Enzymatic Reaction Templates DOI 10.1021/acs.jcim.1c00921 Typ Journal Article Autor Heid E Journal Journal of Chemical Information and Modeling Seiten 4949-4961 Link Publikation -
2021
Titel On the influence of template size, canonicalization and exclusivity for retrosynthesis and reaction prediction applications DOI 10.33774/chemrxiv-2021-9s7gj Typ Preprint Autor Heid E Link Publikation -
2023
Titel Deep Ensembles vs. Committees for Uncertainty Estimation in Neural-Network Force Fields: Comparison and Application to Active Learning DOI 10.48550/arxiv.2302.08805 Typ Other Autor Carrete J Link Publikation -
2024
Titel Chemprop: A Machine Learning Package for Chemical Property Prediction. DOI 10.1021/acs.jcim.3c01250 Typ Journal Article Autor Greenman Kp Journal Journal of chemical information and modeling Seiten 9-17 -
2023
Titel Characterizing Uncertainty in Machine Learning for Chemistry. DOI 10.1021/acs.jcim.3c00373 Typ Journal Article Autor Heid E Journal Journal of chemical information and modeling Seiten 4012-4029 -
2023
Titel Deep ensembles vs committees for uncertainty estimation in neural-network force fields: Comparison and application to active learning. DOI 10.1063/5.0146905 Typ Journal Article Autor Carrete J Journal The Journal of chemical physics -
2023
Titel Characterizing Uncertainty in Machine Learning for Chemistry DOI 10.26434/chemrxiv-2023-00vcg Typ Preprint Autor Heid E -
2023
Titel Characterizing Uncertainty in Machine Learning for Chemistry DOI 10.26434/chemrxiv-2023-00vcg-v2 Typ Preprint Autor Heid E -
2023
Titel Characterizing Uncertainty in Machine Learning for Chemistry DOI 10.26434/chemrxiv-2023-00vcg-v3 Typ Preprint Autor Heid E -
2023
Titel Chemprop: Machine Learning Package for Chemical Property Prediction DOI 10.26434/chemrxiv-2023-3zcfl Typ Preprint Autor Greenman K -
2023
Titel EnzymeMap: Curation, validation and data-driven prediction of enzymatic reactions DOI 10.26434/chemrxiv-2023-jzw9w Typ Preprint Autor Heid E -
2023
Titel EnzymeMap: Curation, validation and data-driven prediction of enzymatic reactions DOI 10.26434/chemrxiv-2023-jzw9w-v2 Typ Preprint Autor Heid E -
2023
Titel Chemprop: A Machine Learning Package for Chemical Property Prediction DOI 10.26434/chemrxiv-2023-3zcfl-v3 Typ Preprint Autor Greenman K -
2023
Titel Chemprop: A Machine Learning Package for Chemical Property Prediction DOI 10.26434/chemrxiv-2023-3zcfl-v2 Typ Preprint Autor Greenman K -
2023
Titel EnzymeMap: curation, validation and data-driven prediction of enzymatic reactions. DOI 10.1039/d3sc02048g Typ Journal Article Autor Heid E Journal Chemical science Seiten 14229-14242 -
2022
Titel Similarity based enzymatic retrosynthesis DOI 10.1039/d2sc01588a Typ Journal Article Autor Sankaranarayanan K Journal Chemical Science Seiten 6039-6053 Link Publikation -
2021
Titel On the influence of template size, canonicalization and exclusivity for retrosynthesis and reaction prediction applications DOI 10.26434/chemrxiv-2021-9s7gj Typ Preprint Autor Heid E Link Publikation -
2021
Titel Machine learning of reaction properties via learned representations of the condensed graph of reaction DOI 10.26434/chemrxiv-2021-frfhz Typ Preprint Autor Heid E Link Publikation -
2021
Titel Machine Learning of Reaction Properties via Learned Representations of the Condensed Graph of Reaction DOI 10.26434/chemrxiv-2021-frfhz-v2 Typ Preprint Autor Heid E Link Publikation -
2021
Titel EHreact: Extended Hasse Diagrams for the Extraction and Scoring of Enzymatic Reaction Templates DOI 10.26434/chemrxiv-2021-jxxbh-v2 Typ Preprint Autor Heid E Link Publikation
-
2023
Link
Titel EnzymeMap DOI 10.5281/zenodo.7841780 Typ Database/Collection of data Öffentlich zugänglich Link Link -
2023
Link
Titel Benchmark Data for Chemprop DOI 10.5281/zenodo.8174267 Typ Database/Collection of data Öffentlich zugänglich Link Link -
2023
Link
Titel EnzymeMap Python package Typ Computer model/algorithm Öffentlich zugänglich Link Link -
2022
Link
Titel ESPsim Typ Computer model/algorithm Öffentlich zugänglich Link Link -
2021
Link
Titel Chemprop Typ Computer model/algorithm Öffentlich zugänglich Link Link -
2021
Link
Titel EHreact Typ Computer model/algorithm Öffentlich zugänglich Link Link -
2021
Link
Titel Templatecorr Typ Computer model/algorithm Öffentlich zugänglich Link Link -
2021
Link
Titel Enzymatic assay data Typ Database/Collection of data Öffentlich zugänglich Link Link -
2021
Link
Titel Reaction Database Typ Database/Collection of data Öffentlich zugänglich Link Link
-
2023
Titel AI4ChemMat Hands-On Series: Deep learning of reaction properties via graph-convolutional neural nets Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad Continental/International -
2022
Titel Austrian Marshall Plan Foundation Poster Award (3rd place) Typ Poster/abstract prize Bekanntheitsgrad National (any country) -
2022
Titel RSC CICAG Open Source Tools for Chemistry: Scoring of shape and ESP similarity Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad Continental/International