Gewichtete Parameterschätzungen in der Cox Regression
Weighted estimation of parameters in Cox regression
Wissenschaftsdisziplinen
Biologie (100%)
Keywords
-
Lebensdaueranalyse,
Therapiestudien,
Studien von prognostischen Faktoren,
Cox Regressionsmodell,
Regression mit großer Prädiktorenzahl,
Zeitabhängige Effekte Von Einflußfaktore
Das Regressionsmodell (CR) von Cox (1972) ist eine der wichtigsten Methoden für die Analyse zensierter Lebensdauern. Häufig ändert sich die Wirkung über die Zeit von zumindest einem der in ein solches Modell aufgenommenen Prognosefaktoren, was die Proportionalitätsannahme verletzt. Dann folgt eine Über- bzw. Unterschätzung des (im Zeitverlauf) durchschnittlichen relativen Risikos für diesen Prognosefaktor, gefolgt von einem Verlust an Effizienz der Parameterschätzung. Im folgenden interessieren wir uns für eine der Lösungen für dieses Problem, und zwar für gewichtete Parameterschätzungen in der Cox Regression (WCR). Trotz günstiger Untersuchungsergebnisse von Schemper (1992), Sasieni (1993), oder Valsecchi, Silvestri und Sasieni (1996) scheint die Methode in Vergessenheit geraten zu sein. WCR ist von Interesse, weil sie (1) unverfälschte Schätzungen des durchschnittlichen relativen Risikos ermöglicht, unabhängig von der Art der Verletzung der proportional hazards` Annahme, (2) die Effizienz der Schätzungen auch bei unterschiedlich zeitabhängigen Faktorwirkungen aufrecht bleibt, (3) die Analysen robuster sind hinsichtlich Ausreißern in den Lebensdauern, und (4), weil sie eine Erweiterung der Tests von Breslow (1970) und Prentice (1978) auf eine multiple Kovariablensituation ermöglicht, wie es auch das Cox Modell für Mantels (1966) Logrank Test darstellt. Wegen dieser attraktiven Eigenschaften und auch wegen positiver Erfahrungen bei der Anwendung von WCR in den letzten Jahren scheint eine systematische Untersuchung von Anwendungsindikationen und auch einige Weiterentwicklungen des Verfahrens lohnend. Das Projekt wird sich mit WCR in drei Anwendungsgebieten der Biostatistik beschäftigen: (A) Studien prognostischer Faktoren, (B) Behandlungseffekte in kontrollierten klinischen Therapiestudien, und (C) Studien von Gen-Expressionen und -polymorphismen. Dabei sollen folgende Fragestellungen genauer behandelt werden: A: Vorteile von WCR über CR unter typischen Szenarien, Modellierung zeitabhängiger Effekte im Rahmen von WCR, Verfahren der Modellprüfung beim WCR B: Nimmt ein Behandlungseffekt im Zeitverlauf unerwartet ab, führt dies zu niedriger Mächtigkeit des üblicherweise verwendeten Logrank Tests. Die Tests nach Breslow und nach Prentice sind jedoch mächtig bei konvergierenden Hazardfunktionen. In solchen Situationen ist Tarones (1981) Test - auf der Basis des Maximums der Breslow- und Logrank Teststatistiken - nützlich. Eine analoge Prozedur soll für die Analyse des Behandlungseffekts unter CR und WCR entwickelt und empirisch überprüft werden. C: Große Anzahlen (g) an Gen-Expressionen oder Gen-Polymorphismen werden in Stichproben mit relativ wenig Sterbefällen (d) hinsichtlich ihrer Wirkungen auf die Lebensdauer geprüft oder zur Entwicklung eines Prognosemodells herangezogen. Dabei gilt: g>>d. WCR-basierte Ansätze könnten den CR-basierten überlegen sein, weil häufig die Proportionalitätsannahme verletzt sein dürfte, zusätzlich auch noch zufällig, wegen der Variabilität kleiner Stichproben. Wir werden diese Untersuchungen im Rahmen pönalisierter Cox Regressionen durchführen, die Schlüsse werden auch für andere Verfahren zur Cox-Analyse großer Anzahlen an Prädiktoren gelten. Die Ergebnisse des Projekts werden mittels umfangreicher Monte Carlo Studien sowie durch vergleichende Analysen medizinischer Datensätze errechnet. Mögliche Vorteile von WCR-Methoden werden quantifiziert durch Bias und Variabilität von Schätzern sowie mittels Vorhersagegenauigkeit, erklärter Variabilität und ROC-Maßen. Die im Rahmen des Projekts zu entwickelnde Software wird zum freien Download (Versionen in R, S-Plus und als SAS-Makros) zur Verfügung gestellt.
Eine wichtige Aufgabe der klinischen Biometrie ist die Untersuchung der Wirkung möglicher Prognosefaktoren (Behandlungen und Patientencharakteristika wie Alter, Geschlecht oder Krankheitssubtyp) auf das Überleben nach Behandlungsbeginn einer chronischen Erkrankung (z.B. Krebs). Zu diesem Zweck wird ein mathematisches Modell an die Stichprobe einer klinischen Studie angepasst. Es ist von medizinischem Interesse, den Effekt von Prognosefaktoren auf die verbleibende Überlebenszeit zu quantifizieren, z.B., mittels der Differenz der medianen Überlebenszeiten aus zwei Patientengruppen mit unterschiedlichen Behandlungen. In den letzten Jahrzehnten ist das proportional hazards Modell nach Cox zum Standard für die Untersuchung der Bedeutung von Prognosefaktoren hinsichtlich Überleben geworden. Das Modell quantifiziert den Unterschied in der Wirkung zweier Behandlungen mit einem Hazard-Quotienten - z.B. der Quotient der Sterberisiken unter der ersten versus unter der zweiten Behandlung, jeweils auf einen beliebigen Tag der Nachbeobachtung bezogen. In seiner einfachsten Spezifikation setzt das proportional hazards Modell voraus, dass der Hazard-Quotient für zwei Ausprägungen eines Prognosefaktors im Nachbeobachtungszeitraum konstant bleibt. Wenn sich jedoch, in einer Stichprobe, der Hazard-Quotient im Zeitverlauf ändert, kann diese Änderung unter Verwendung zeitabhängiger Terme im Modell berücksichtigt werden. Alternativ dazu kann im proportional hazards Modell ein über die Zeit durchschnittlicher Effekt mathematisch geschätzt werden, ein durchschnittlicher Hazard-Quotient. Dieser Ansatz hat in der Literatur bisher eher wenig Beachtung gefunden. Es ist daher Ziel unseres Forschungsprojektes, diese Methode genauer zu untersuchen und neue statistische Verfahren zu entwickeln, um mithilfe gewichteter Parameterschätzungen im proportional hazards Regressionsmodell durchschnittliche Hazard-Quotienten zu erhalten. Die Methode benötigt wenig Modellparameter und ist daher besonders interessant bei kleinen Stichprobenumfängen und/oder einer großen Zahl an Prognosefaktoren; weiters, wenn kein medizinisches Interesse an der Analyse der Zeitabhängigkeit einer Wirkung besteht. Im Rahmen des Projekts konnten interessante mathematische Zusammenhänge mit anderen statistischen Maßen gezeigt werden. Fragen der Behandlung von zensierten Lebensdauern einiger Patienten konnten passend geklärt werden. Die eher schwierigeren Probleme zur statistischen Inferenz, also die Eingrenzung der Zufälligkeit geschätzter Effekte, konnten befriedigend gelöst werden. Umfangreiche Simulationsstudien belegen die Eignung der vorgeschlagenen statistischen Verfahren. Diese stehen nun in bedienerfreundlicher Software in SAS und R zum freien Download zur Verfügung.
Research Output
- 337 Zitationen
- 4 Publikationen
-
2008
Titel Avoiding infinite estimates of time-dependent effects in small-sample survival studies DOI 10.1002/sim.3418 Typ Journal Article Autor Heinze G Journal Statistics in Medicine Seiten 6455-6469 -
2011
Titel Non-parametric estimation of relative risk in survival and associated tests DOI 10.1177/0962280211431022 Typ Journal Article Autor Wakounig S Journal Statistical Methods in Medical Research Seiten 856-870 -
2009
Titel The estimation of average hazard ratios by weighted Cox regression DOI 10.1002/sim.3623 Typ Journal Article Autor Schemper M Journal Statistics in Medicine Seiten 2473-2489 -
2010
Titel Gene selection in microarray survival studies under possibly non-proportional hazards DOI 10.1093/bioinformatics/btq035 Typ Journal Article Autor Dunkler D Journal Bioinformatics Seiten 784-790 Link Publikation