Analyse funktionaler Daten durch approximative Faktormodelle
Analysing functional data by approximate factor models
Wissenschaftsdisziplinen
Mathematik (100%)
Keywords
-
Approximate Factor Models,
Functional Data,
High Dimensional Inference,
Preprocessing
Die rasanten technischen Fortschritte ermöglichen es stets noch größere Datenmengen in den unterschiedlichsten Lebensbereichen zu sammeln und zu speichern. Um aus dieser Datenflut nützliche Informationen zu extrahieren, ist deren adäquate Aufbereitung und Auswertung unabdingbar. Folglich ist es wenig erstaunlich, dass sich im Einklang mit diesem rasanten Datenwachstum viele neue wissenschaftliche Disziplinen entwickelt haben, die sich genau diesen Problemen widmen. Die funktionale Datenanalyse ist eine solche Disziplin. Von funktionalen Daten spricht man, wenn die jeweiligen Beobachtungen als Prozesse in kontinuierlicher Zeit aufgefasst werden können. Ein Beispiel dazu sind Tagesverläufe von Schadstoffmessungen an einer bestimmten Messstelle. Jede solche Verlaufskurve wird als ein Datenpunkt in der Stichprobe betrachtet. In der Praxis ist es aber nicht möglich die Verlaufskurven auch wirklich kontinuierlich zu messen. Stattdessen gibt es eine Messsequenz mit einer bestimmten Auflösung (z.B. Halbstundenwerte). Darüber hinaus sind die Messungen oft ungenau. Wenn wir zum Beispiel die Feinstaubkonzentration in der Luft messen, dann ist zum einen die zugrundeliegende Messtechnik äußert komplex und folglich fehle rbehaftet, und zum anderen können lokale äußere Einflüsse (beispielsweise Zigarettenrauch in unmittelbarer Nähe der Messstation) kurzfristig zu erheblichen Abweichungen führen. Bezogen auf dieses Beispiel, versuchen wir in unserem Projekt die latente aber eigentliche Schadstoffkonzentration (wir bezeichnen das als Signal) zu schätzen und von den Fehlern zu trennen. Diese Problemstellung tritt in sehr vielen funktionalen Datensätzen auf und wird im Preprocessing in der Regel durch Glättungsverfahren behandelt. Dabei glättet man aber jede verrauschte Kurv e einzeln. Man trainiert folglich das Modell nicht mit dem gesamten Datensatz. Außerdem ist der adäquate Grad der Glättung in der Praxis schwer einzuschätzen. In diesem Projekt erforschen wir einen alternativen und innovativen Ansatz. Mithilfe von approximativen Faktormodellen, die bis dato hauptsächlich in der Makroökonometrie zur Modellierung von hochdimensionalen Finanzdaten verwendet wurden, lernen wir aus der Gesamtheit der verfügbaren Daten und versuchen so ohne spezifische Annahmen das Signal effizient zu rekonstruieren. Vorläufige Ergebnisse zeigen, dass diese Methode äußert gut funktioniert und auch theoretisch begründbar ist. Durch diesen alternativen Lösungsansatz ergeben sich etliche offene Fragestellungen und eine Reihe von Erweiterungen d ie wir im Rahmen dieses Projekts erarbeiten werden.
- Technische Universität Graz - 100%