Triple Gamma Shrinkage für Gaußsche Prozess Regression
Triple Gamma Shrinkage for Gaussian Process Regression
Wissenschaftsdisziplinen
Mathematik (60%); Wirtschaftswissenschaften (40%)
Keywords
-
Gaussian Process,
Bayesian Inference,
Shrinkage,
Variational Inference,
Markov chain Monte Carlo
Viele Entscheidungsprozesse in der modernen Welt werden von statistischen Modellen unterstützt. Sie werden zum Beispiel verwendet, um das Wetter vorherzusagen, die Ausbreitung von Krankheiten zu modellieren und wirtschaftliche Entwicklungen vorherzusagen. Ein wichtiger Kompromiss bei der Entwicklung solcher Modelle ist die Balance zwischen Flexibilität und Interpretierbarkeit. Sehr flexible Modelle können komplexe Beziehungen in den Daten erfassen, jedoch macht ihre Black-Box-Natur es oft schwierig zu verstehen, wie sie zu ihren Vorhersagen gelangen. Dieser Nachteil kann in kritischen Anwendungen, wie medizinischen Diagnosen oder Finanzprognosen, problematisch werden. Auf der anderen Seite machen interpretierbare Modelle oft zu viele Annahmen über Beziehungen zwischen Variablen, was ihre Fähigkeit zur Erfassung komplexer Muster in den Daten einschränkt. Eine weitere Komplikation besteht in der zunehmenden Verfügbarkeit von hochdimensionalen Daten, bei denen die Anzahl der erklärenden Variablen oft die Anzahl der Beobachtungen übersteigt. In solchen Szenarien ist es entscheidend, die relevanten Variablen für genaue Vorhersagen und Interpretierbarkeit zu bestimmen. Das Forschungsprojekt zielt darauf ab, diese Probleme zu lösen, indem flexible Gaussian Process Regression (GPR) Modelle mit modernen Variablenselektionswerkzeugen aus dem Bereich der Bayes-Statistik verschmolzen werden. GPR-Modelle sind ein flexibles Werkzeug für die Regressionsanalyse, da sie nur wenige Annahmen über die Form der Beziehung zwischen Variablen treffen, aber dennoch Interpretierbarkeit ermöglichen. Mit zunehmender Anzahl von Variablen kann jedoch die Flexibilität von GPR-Modellen zu großen Vorhersageunsicherheiten führen, was wiederum die Interpretierbarkeit verringert. Das vorgeschlagene Forschungsprojekt wird die Verwendung sogenannter "Shrinkage Priors", Werkzeuge für die bayesianische Variablenselektion, untersuchen, um automatisch die Variablen zu bestimmen, die das Ergebnis in GPR-Modellen beeinflussen. Die Hauptidee hinter Shrinkage Priors besteht darin, kleine Parameterwerte stark gegen null zu ziehen, während größere Parameterwerte größtenteils unberührt bleiben. Dies ermöglicht die automatische Auswahl von Variablen, die für das Ergebnis relevant sind (was synonym mit einem großen Abstand von null ist), während gleichzeitig die Flexibilität des GPR-Modells erhalten bleibt. Solche Modelle hätten Anwendungen in einer Vielzahl von Bereichen wie Wirtschaft, Biologie und Ingenieurwissenschaften. Das Forschungsprojekt wird nicht nur zur Literatur über GPR- Modelle und bayesianische Variablenselektion beitragen, sondern auch ein wertvolles Werkzeug für Forscher in einer Vielzahl von Bereichen bereitstellen. Die entwickelten Algorithmen werden der breiteren wissenschaftlichen Gemeinschaft in Form eines R-Pakets zur Verfügung gestellt, um eine einfache Anwendung auf andere Datensätze und die weitere Entwicklung der Algorithmen zu ermöglichen.
- Harvard University - 100%