[Zurück zur Trefferliste]

Behandlung und Ersetzung fehlender Kovariablen in Studien der Versorgungsforschung zur Kontrolle der Confounderproblematik am Beispiel des Propensity Score

 

Projektkennung VfD_11_001671
Laufzeit von 09/2011 bis 03/2013
Status des Projekts abgeschlossen

 

Projektbeschreibung

Fragestellung(en) Ziel des beantragten Projekts ist es, adäquate Strategien und Methoden zur Ersetzung fehlender Kovariablen zu identifizieren und zu untersuchen, um damit die Basis für eine korrekte Schätzung von PS über ein logistisches Regressionsmodell zu schaffen. Dadurch soll das Gebiet der Versorgungsforschung insofern profitieren, dass die Voraussetzungen für eine valide Schätzung der Zielgrößeneffekte im Rahmen von Beobachtungsstudien gesichert werden. Das Vorhandensein von fehlenden Daten, vor allem in Sekundärvariablen, geht stets einher mit einem Verlust an Informationen, was in der Konsequenz eine Reduktion der Schätzgenauigkeit bedeutet. Im Projekt sollen die identifizierten Strategien und Methoden auf Anwendbarkeit und statistische Eigenschaften untersucht werden, um international anerkannte Ergebnisse in Studien der Versorgungsforschung erzielen zu können. Nach dem
Projekt sollen die entwickelten Lösungsmöglichkeiten im Rahmen publizierter praktischer Empfehlungen zur Verfügung gestellt werden. Da das Thema „Fehlende Werte“ derzeit in Fachkreisen viel diskutiert wird, besteht ein großes Interesse an soliden, methodischen Arbeiten, sowohl im Umfeld der Versorgungsforschung, als auch der biometrischen
Forschung. Insbesondere sollen die Ergebnisse und Erkenntnisse des Projektes als Basis für eigenständige Anträge an die DFG bzw. das BMBF im Rahmen entsprechender Programme dienen.
Hintergrund / Ziele In der Versorgungsforschung werden oftmals Studientypen zur Untersuchung bestimmter Aspekte der Kranken- und Gesundheitsversorgung in ihren Rahmenbedingungen genutzt, die im Gegensatz zu randomisierten kontrollierten Studien den Nachteil haben, dass sie a priori keine Strukturgleichheit der Vergleichsgruppen gewährleisten können. Es handelt sich dabei insbesondere um prospektive kontrollierte Kohortenstudien. Diese Studienform ist für die Fragestellungen aus dem Bereich der Versorgungsforschung sehr gut geeignet, da diese vor allem die Beschreibung realistischer Anwendungssituationen hinsichtlich
bestimmter Fragestellungen zum Ziel haben bzw. aufzeigen sollen, wie sich die „tatsächlichen Versorgungseffekte unter Alltagsbedingungen darstellen“ [1]. Da mittels einer Beobachtungsstudie nur teilweise über verschiedene Matching-, Stratifizierungs- und Analysemethoden auf die Strukturgleichheit der Vergleichsgruppen Einfluss genommen werden kann, besteht bei dieser Studienform das prinzipielle Problem, dass der zu
schätzende Behandlungseffekt eventuell aufgrund potentieller Confounder verzerrt ist. Als Confounder werden Einflussvariablen bezeichnet, die als so genannte Störgrößen auf die Zielvariable zur Beschreibung der Versorgungseffektivität wirken und es somit verhindern, dass der unter Umständen beobachtete Effekt allein auf eine unterschiedliche Behandlung
der Vergleichsgruppen zurückzuführen ist. Im Grunde sind auch randomisierte Studien von dieser Problematik betroffen, da selbst in deren Rahmen nicht alle Confounder kontrolliert werden können. Ein oftmals genutzter Ansatz zur Lösung dieser Confounderproblematik ist
der Einsatz so genannter Propensity Scores (PS). Ein PS beschreibt die Wahrscheinlichkeit einer Beobachtungseinheit, unter einer gegebenen und bekannten Menge an Kovariablen einem bestimmten Zustand (z.B. die Zugehörigkeit zur Behandlungsgruppe) zugeordnet zu werden. Die Berechnung von PS für jeden Teilnehmer einer Beobachtungsstudie ermöglicht es dann, über verschiedene Ansätze die PS so zu nutzen, dass eine unverzerrte Schätzung des Zielgrößeneffektes möglich ist. Bekannte Ansätze sind beispielsweise ein Matching von Patienten der Behandlungs- und Kontrollgruppen über ihre PS oder eine Zielgrößenadjustierung über die berechneten PS mit Hilfe eines entsprechenden Regressionsmodells. Die Berechnung der PS erfolgt meist über ein logistisches
Regressionsmodell, dessen unabhängige Variablen durch die interessierenden Kovariablen der Untersuchung gegeben sind. Eine valide Bestimmung der PS über diesen Ansatz ist allerdings nur möglich, wenn die zur Berechnung verwendeten Kovariablen vollständig vorhanden sind. Tatsächlich ist es so, dass man sich nahezu immer mit fehlenden Werten im Rahmen von Studien auseinandersetzen muss, weshalb die beschriebene Problematik einen wesentlichen Aspekt der Forschung darstellt. Eine angemessene Behandlung fehlender Kovariablen bedeutet somit eine notwendige Bedingung für die korrekte Berechnung und Verwendung von PS.
Methodik Zunächst wird eine extensive Literaturrecherche durchgeführt, um den Einsatz bekannter Ersetzungsmethoden für fehlende Kovariablen im Rahmen eines logistischen Regressionsmodells zu verifizieren und gegebenenfalls neue Ansätze für die Ersetzung zu identifizieren. Zudem ist es notwendig, die Vorgaben für den Umgang mit fehlenden Kovariablen in den Regelwerken für klinische Studien, den entsprechenden Behörden
(BfArM, EMEA, FDA) und den Memoranden für die Versorgungsforschung zu dokumentieren und zusammenzufassen. Der Fokus des Arbeitsprogramms liegt dann auf der Untersuchung verschiedener Ersetzungsmethoden. Zunächst werden die in der Literatur vorgeschlagenen Ersetzungsmethoden auf ihre Umsetzbarkeit und Praktikabilität hin untersucht. Darüber
hinaus werden an typischen Datensätzen der Versorgungsforschung die Methoden angewendet, um Erfahrungen sammeln zu können in Bezug auf die Anwendbarkeit der Methoden zur Ersetzung der Kovariablen und der daraus resultierenden Sensitivität der geschätzten PS. Zusätzlich werden im Rahmen einer Simulation die Auswirkungen einer auf Basis ersetzter Kovariablen erfolgten Schätzung der PS auf deren Einsatz zur Adjustierung des Behandlungseffektes im Rahmen von Studien der Versorgungsforschung untersucht. Die gewonnenen Erkenntnisse sollen dann in für die Versorgungsforschung bedeutenden Journalen veröffentlicht werden und so dem entsprechenden Zielpublikum zugänglich
gemacht werden, um darauf basierend die methodischen Entwicklungen weiter voranzutreiben, z.B. im Rahmen von Folgeanträgen.
Datenbasis Sekundärdaten
   Krankenkassen - GKV  (Stichprobengröße: k.A.)
Studiendesign Längsschnittstudie
Beobachtungsstudie
Untersuchte Geschlechter weiblich und männlich
Untersuchte Altersgruppen nicht untersucht
Ergebnisse Fehlende Werte finden in der Versorgungsforschung zu selten Erwähnung und werden nicht angemessen behandelt. Zudem können bestimmte Gegebenheiten der Versorgungsforschung einen zusätzlichen Nachteil für die grundlegenden Missing Value Probleme bedeuten.

Forschende und kooperierende Einrichtungen

Projektverantwortliche

Förderung

Veröffentlichungen

Schlagwörter

 

Stand: 20.01.2016