Langfristige Risikovorhersage mit kurzfristigen Big Data
Long-Term Risk Prediction from Short-Term Big Data
Wissenschaftsdisziplinen
Andere Humanmedizin, Gesundheitswissenschaften (100%)
Keywords
-
Big Data,
Long-Term Prediction,
Simulation,
Microsimulation,
Time-To-Event,
Competing Risk
Langfristige Vorhersagen müssen auf langfristigen Beobachtungen beruhen. Entsprechende Vorhersagemodelle sind also oft schon veraltet, wenn sie gerade erst erstellt wurden. In der Medizin bedeutet das, dass mögliche Veränderungen grundlegender Risikofaktoren wie z.B. Blutdruck, Behandlungsmöglichkeiten oder der allgemeinen Mortalität in Vorhersagemodellen nicht berücksichtigt werden können. Mit der digitalen Automatisierung entstanden riesige Datensätze, sogenannte Big Data, welche rezente Daten von 100,000en von Personen enthalten, wenn auch oft mit nur kurzem Beobachtungszeitraum. Wir haben eine Formel zur Vorhersage des 5- jährigen kardiovaskulären Risikos anhand von anonymen Daten von 2.4 Mio. Personen, die an einer Vorsorgeuntersuchung in Österreich zwischen 2009 und 2015 teilgenommen haben, entwickelt. Besonders für junge Menschen wären jedoch langfristige Vorhersagen, eventuell sogar des lebenslangen Risikos, viel wichtiger. Deshalb wollen wir in diesem Forschungsprojekt neue Methoden entwickeln, um Langfristige Risikovorhersagen mit Big Data machen zu können. Zunächst wollen wir Vorsorgeuntersuchungsreihenvon mehrerenähnlichen Personenmit unterschiedlichem Alter zu langfristigen Pseudo-Gesundheitsakten verbinden. Dadurch gewinnen wir längere Beobachtungszeiträume, verkleinern aber die Anzahl unterschiedlicher Akten im Vergleich zur ursprünglichen Personenzahl. Hier stellt sich das Problem, herauszufinden, wie man die Akten am besten automatisiert verbindet, und ob dadurch systematische Verzerrungen entstehen könnten. Anhand der Pseudo-Gesundheitsakten könnte dann die Entwicklung der Risikofaktoren über das Alter und die Zeit bis zum Auftreten eines kardiovaskulären Ereignisses zu langfristigen Vorhersagemodelle entwickelt werden. Dafür könnte man sogenannte gemeinsame Modell beziehungweise Machine Learning Methoden anwenden. In einem zweiten Ansatz wollen wir untersuchen, wie man wiederholte kurzzeitige Vorhersagen zu einer verlässlichen langfristigen Vorhersage verknüpfen kann, entweder durch Computersimulationen oder durch mathematische Vereinfachungen. Diese synthetischen Daten, die lange Beobachtungen umfassen, können ähnlich analysiert werden wie die oben-genannten Pseudo- Gesundheitsakten. Für die Entwicklung unserer Methoden und deren Validierung können wir einen anonymen Datensatz von mehr als 185,000 Personen, die im Median fast 30 Jahre beobachtet wurden, verwenden. Mit dem Projekt sollen Methoden bereitgestellt und untersucht werden, die man zur Entwicklung eines österreichischen bevölkerungsbasierten Gesundheitsmodells für kardiovaskuläre und andere chronische Erkrankungen brauchen wird. Diese Methodik kann auch in anderen Wissenschaftsgebieten, in denen langfristige Vorhersagen basierend auf großen aktuellen Daten von Interesse sind, Anwendung finden.
- Hanno Ulmer, Medizinische Universität Innsbruck , nationale:r Kooperationspartner:in
- Georg Dorffner, Medizinische Universität Wien , nationale:r Kooperationspartner:in
- Georg Lukas Heinze, Medizinische Universität Wien , nationale:r Kooperationspartner:in
- Cécile Proust-Lima, Université de Bordeaux - Frankreich
- Hélène Jacqmin-Gadda, Université de Bordeaux - Frankreich