Probabilistische Graphische Meodelle: Theorien und Anwendungen
Gaussian Graphical Models: Theory and Applications
Wissenschaftsdisziplinen
Mathematik (100%)
Keywords
-
Algebraic statistics,
Causal Interference,
Gaussian graphical models,
Occam's razor,
Maximum likelihood estimaton,
Convex optimization
Meine Forschung zielt darauf, probabilistische graphische Modelle besser zu verstehen und Algorithmen zu entwickeln, welche die praktische Anwendung dieser Modelle zu wissenschaftlich relevante Fragestellungen ermöglicht. Das beantragte Projekt befindet sich an der Schnittstelle der mathematischen Statistik, der konvexen Optimierung und der angewandten algebraischen Geometrie; drei Gebiete, die in den letzten Jahren eine starke Wechselwirkung gezeigt haben. Mein Ziel über die nächsten sechs Jahre ist es, Wissen und Erkenntnisse über graphische Modelle auszubauen und die Verbindungen zwischen der mathematischen Statistik, der konvexen Optimierung und der angewandten algebraischen Geometrie durch meine Forschung und Lehrtätigkeit zu vertiefen. Mein Antrag besteht aus drei Projekten, alle an der Schnittstelle dieser drei Gebiete. Im ersten Projekt werde ich Methoden zur Bestimmung kausaler Zusammenhänge auf Basis von Beobachtungsdaten entwickeln, die ohne randomisierte kontrollierte Studien auskommen. Diese Methoden werden Vorwissen integrieren können und Rückmeldungen zulassen. Dies ist besonders wichtig für biologische Anwendungen, wo Rückmeldungen unerlässlich sind. Ich werde diese neuen Methoden praktisch umsetzen, um Genregulationsnetzwerke aus Genexpressionsdaten über die gesamte Entwicklung von Drosophila abzuleiten. Zudem werde ich Daten aus dem GTEx (Genotype-Tissue Expression) Projekt analysieren und daraus gewebe- und personenspezifische Genregulationsnetzwerke ableiten. Dieses Projekt ist höchst aktuell, da sich das GTEx Projekt momentan in der Aufbauphase befindet. Das zweite Projekt beschäftigt sich mit der Maximum-Likelihood-Methode in normalverteilten Modellen mit linearen Nebenbedingungen auf der Kovarianzmatrix. Solchen Modellen begegnet man in vielen Anwendungen, zum Beispiel bei der Analyse von Zeitreihendaten, bei der Konstruktion von phylogenetischen Stammbäumen oder bei der Analyse der Konnektivität von Internetverbindungen. Ich werde Methoden entwickeln, um die Struktur in solchen Modellen zu identifizieren. Diese werde ich dann praktisch umsetzen und phylogenetische Stammbäume basierend auf Intron Länge konstruieren, sowie die Topologie des Internets analysieren. Das dritte Projekt bezieht sich auf die Bayesianische Entscheidungstheorie in normalverteilten graphischen Modellen. Die G-Wishart Verteilung ist äußerst begehrenswert, da diese Verteilung der konjugierte Prior für dieses Modell ist. Trotzdem wurde diese Verteilung kaum angewendet, da die Normalisierungskonstante unbekannt war. Kürzlich haben wir dieses 20 Jahre alte Problem gelöst und eine Formel für die Normalisierungskonstante gefunden. Wir werden dieses theoretische Ergebnis in der Wettervorhersage anwenden, wo Modelle mit Tausenden von Variablen notwendig sind und nun mit der neuen Formel für die Normalisierungskonstante auch analysiert werden können.
Meine Forschung zielt darauf, probabilistische graphische Modelle besser zu verstehen und Algorithmen zu entwickeln, welche die praktische Anwendung dieser Modelle zu wissenschaftlich relevante Fragestellungen ermöglicht. Dieses Projekt befindet sich an der Schnittstelle der mathematischen Statistik, der konvexen Optimierung und der angewandten algebraischen Geometrie; drei Gebiete, die in den letzten Jahren eine starke Wechselwirkung gezeigt haben. Mein Ziel war es, Wissen und Erkenntnisse über graphische Modelle auszubauen und die Verbindungen zwischen der mathematischen Statistik, der konvexen Optimierung und der angewandten algebraischen Geometrie durch meine Forschung und Lehrtätigkeit zu vertiefen. Mein Antrag bestand aus drei Projekten, alle an der Schnittstelle dieser drei Gebiete. Im ersten Projekt habe ich Methoden zur Bestimmung kausaler Zusammenhänge auf Basis von Beobachtungsdaten entwickelt, die ohne randomisierte kontrollierte Studien auskommen. Diese Methoden koennen Vorwissen integrieren. Dies ist besonders wichtig für biologische Anwendungen. Ich habe diese neuen Methoden auch praktisch umgesetzt, um Genregulationsnetzwerke aus Genexpressionsdaten abzuleiten. Insbesondere habe ich Expressionsdaten von einzelnen Zellen analysieren und daraus gewebespezifische Genregulationsnetzwerke abgeleitet. Das zweite Projekt hat sich mit der Maximum-Likelihood-Methode in normalverteilten Modellen mit linearen Nebenbedingungen auf der Kovarianzmatrix beschaeftigt. Solchen Modellen begegnet man in vielen Anwendungen, zum Beispiel bei der Analyse von Zeitreihendaten, bei der Konstruktion von phylogenetischen Stammbäumen oder bei der Analyse der Konnektivität von Internetverbindungen. Ich habe Methoden entwickelt, um die Struktur in solchen Modellen zu identifizieren. Diese habe ich dann praktisch umgesetzt um phylogenetische Stammbäume zu konstruieren. Das dritte Projekt hat sich auf die Bayesianische Entscheidungstheorie in normalverteilten graphischen Modellen bezogen. Die G-Wishart Verteilung ist äußerst begehrenswert, da diese Verteilung der konjugierte Prior für dieses Modell ist. Trotzdem wurde diese Verteilung kaum angewendet, da die Normalisierungskonstante unbekannt war. Wir haben dieses 20 Jahre alte Problem gelöst und eine Formel für die Normalisierungskonstante gefunden. Wir arbeiten nun daran, dieses theoretische Ergebnis in der Wettervorhersage anzuwenden, wo Modelle mit Tausenden von Variablen notwendig sind.
- Lior Pachter, California Institute of Technology - Vereinigte Staaten von Amerika
- Donald Richards, University of Pennsylvania - Vereinigte Staaten von Amerika
- Robert Nowak, University of Wisconsin-Madison - Vereinigte Staaten von Amerika
Research Output
- 291 Zitationen
- 9 Publikationen
-
2018
Titel Generalized Permutohedra from Probabilistic Graphical Models DOI 10.1137/16m107894x Typ Journal Article Autor Mohammadi F Journal SIAM Journal on Discrete Mathematics Seiten 64-93 Link Publikation -
2016
Titel Exponential varieties DOI 10.1112/plms/pdv066 Typ Journal Article Autor Michalek M Journal Proceedings of the London Mathematical Society Seiten 27-56 Link Publikation -
2016
Titel Extremal positive semidefinite matrices whose sparsity pattern is given by graphs without K5 minors DOI 10.1016/j.laa.2016.07.026 Typ Journal Article Autor Solus L Journal Linear Algebra and its Applications Seiten 247-275 Link Publikation -
2016
Titel Geometric control and modeling of genome reprogramming DOI 10.1080/19490992.2016.1201620 Typ Journal Article Autor Uhler C Journal BioArchitecture Seiten 1-9 Link Publikation -
2017
Titel Total positivity in Markov structures DOI 10.1214/16-aos1478 Typ Journal Article Autor Fallat S Journal The Annals of Statistics Seiten 1152-1184 Link Publikation -
2017
Titel Orientation and repositioning of chromosomes correlate with cell geometry–dependent gene expression DOI 10.1091/mbc.e16-12-0825 Typ Journal Article Autor Wang Y Journal Molecular Biology of the Cell Seiten 1997-2009 Link Publikation -
2018
Titel Exact formulas for the normalizing constants of Wishart distributions for graphical models DOI 10.1214/17-aos1543 Typ Journal Article Autor Uhler C Journal The Annals of Statistics Seiten 90-118 Link Publikation -
0
Titel Consistency guarantees for Permutation-based causal inference algorithms. Typ Other Autor Solus L -
2016
Titel Maximum Likelihood Estimation for Linear Gaussian Covariance Models DOI 10.1111/rssb.12217 Typ Journal Article Autor Zwiernik P Journal Journal of the Royal Statistical Society Series B: Statistical Methodology Seiten 1269-1292 Link Publikation