Quantifizierung von Abhängigkeiten via Dimensionsreduktion
ReDim: Quantifying dependence via dimension reduction
Wissenschaftsdisziplinen
Mathematik (100%)
Keywords
-
Copulas,
Coefficient of correlation,
Coefficient of determination,
Directed dependence,
Multivariate rank statistics,
Dimension reduction
Das Erkennen und Schätzen von strukturellen Zusammenhängen zwischen zufälligen Größen ist eine in zahlreichen Anwendungsgebieten (Versicherungs- und Finanzwesen, Biologie, Geologie, Medizin etc.) auftretende Problemstellung und gleichzeitig eine der wichtigsten und spannendsten Forschungsfragen des Forschungsgebiets Abhängigkeitsmodellierung. Oft wird statistische Abhängigkeit zwischen zufälligen Größen als eine richtungsfreie Eigenschaft angesehen, d.h. der Einfluss von Größe X auf Größe Y ist genauso stark wie der Einfluss von Größe Y auf Größe X. In diesen Fällen sind sowohl der Korrelationskoeffizient nach Pearson als auch die Rangkorrelationskoeffizienten nach Spearman und Kendall beliebte und häufig verwendete Indizes, um Aussagen über die Stärke des gegenseitigen Einflusses abzuleiten. Im Gegensatz dazu kann bei Vorliegen von kausalen Zusammenhängen Größe X einen stärkeren Einfluss auf Größe Y haben als umgekehrt. In diesen Fällen ist es sinnvoll, Koeffizienten zu verwenden, welche die Richtung des Zusammenhangs zwischen den zufälligen Größen berücksichtigen. Dabei stehen zwei Extreme im Fokus: (1) Lässt sich die Zielgröße Y vollständig als Funktion von Variable X beschreiben, dann spricht man von perfekter Abhängigkeit. (2) Ist es andererseits nicht möglich, mit Hilfe der Variable X Informationen über die Zielgröße Y zu generieren, dann spricht man von Unabhängigkeit. Dieses Projekt behandelt den letztgenannten Typus: gerichtete Abhängigkeiten. Grundsätzlich sollen Methoden entwickelt werden, um die Stärke des Einflusses einer oder mehrerer erklärender Variablen auf eine Zielgröße quantifizieren zu können. Je mehr erklärende Variablen dabei berücksichtigt werden, d.h. je höher die Dimension, desto schwieriger wird normalerweise die Schätzung (Fluch der Dimensionalität). Um diesem Problem zu entgehen, soll eine Dimensionsreduktion durchgeführt werden, welche die relevante Information über die gerichtete Abhängigkeit der involvierten Größen unberührt lässt. Die Motivation hinter diesem Projekt ist vielfältig: Einerseits steckt hinter der Dimensionsreduktion eine komplexe und sehr spannende mathematische Problemstellung. Andererseits lassen sich die beschriebenen Methoden dazu verwenden, die Vorhersagbarkeit und Erklärbarkeit einer Zielgröße mittels mehrerer potentiell erklärender Variablen effektiv zu messen. Damit ist es möglich, bei hochdimensionalen Datensätzen, welche in der Praxis häufig vorkommen, die relevanten Variablen herauszufiltern und sich bei der Modellbildung auf diese relevanten Variablen zu beschränken (Variablenselektion, Feature Selection).
- Universität Salzburg - 100%
- Wolfgang Trutschnig, Universität Salzburg , nationale:r Kooperationspartner:in
- Fabrizio Durante, Universita del Salento - Italien
Research Output
- 40 Zitationen
- 13 Publikationen
- 1 Software