Dokumentieren nutzt der Forschung
von Philipp Grätzel
Bodenschätze heißen Bodenschätze, weil sie tief im Boden liegen und mit entsprechenden Werkzeugen und Technologien geborgen werden müssen. Erdöl war der König der Bodenschätze im fossilen Zeitalter. Neue Erden und seltene Metalle dürften es in der Epoche der erneuerbaren Energien werden. Auch ein modernes Gesundheitswesen verfügt über Bodenschätze: Daten sind das neue Öl, heißt es oft, und tatsächlich reicht diese Analogie relativ weit. Wie Erdöl sind Daten nicht einfach so zugänglich. Sie müssen zuerst erreicht werden, und danach gilt es, sie intelligent zu verarbeiten, damit am Ende etwas dabei herauskommt, das der Welt – dem Gesundheitswesen – nützt.
Gesundheitsdaten – Was ist das eigentlich?
Der Begriff „Gesundheitsdaten“ ist vielschichtig, und es gibt unterschiedliche Möglichkeiten, ihn ein wenig zu strukturieren. Gängig ist die Unterscheidung zwischen Daten, die (unter anderem in medizinischen Registern oder randomisierten Studien) eigens für die Forschung erhoben werden, und solchen, die in der Versorgung, im medizinischen Alltag anfallen. Für Letztere hat sich der Begriff „Routinedaten“ eingebürgert. Routinedaten in diesem Sinne sind zum einen die Abrechnungsdaten, die bei den Kostenträgern, den Apothekenrechenzentren oder den Kassenärztlichen Vereinigungen entstehen, zum anderen die „primären“ medizinischen Daten, die in Arztpraxen, Krankenhäusern und anderen Gesundheitseinrichtungen im Versorgungsalltag dokumentiert werden.
Eine weitere Teilkategorie sind Daten, die bei den Patientinnen und Patienten anfallen. Das können Messwerte wie von tragbaren Sensoren, sogenannten Wearables, sein. Es können aber auch selbst generierte Daten sein, zum Beispiel im Rahmen eines digitalen Krankheitstagebuchs. Diese letztgenannten Daten werden, wenn sie im Forschungskontext genutzt werden, auch ¬Patient-Reported Outcomes (PRO) genannt. Ein sehr populärer Oberbegriff für patientenseitige Daten einerseits und Routinedaten aus medizinischen Einrichtungen und Abrechnungsinstanzen andererseits lautet „Real World Data“ oder „Real-World Daten“, oft abgekürzt RWD. Werden RWD für wissenschaftliche Zwecke genutzt, dann sprechen viele von „Real-World Evidence“ – also medizinische Evidenz –, die nicht durch prospektive, kontrollierte Studien, sondern durch die Auswertung von Routinedaten und patientenseitigen Daten generiert wird.
Länder mit Routinedatennutzung liefen allen davon
Was für ein veritabler Schatz Gesundheitsdaten sind, hat die Pandemie gezeigt. Länder, in denen Versorgungsdaten relativ gut digital zugänglich sind – vor allem Israel und Großbritannien, aber auch einige skandinavische Länder – produzierten COVID-Evidenz am Fließband, während andere Länder, darunter Deutschland, nur neidisch zusehen konnten. Das betraf sowohl Daten zu den Verläufen von COVID-Infektionen als auch Daten zu Impfstoffen und Impfkampagnen.
Auch aus Gründen, die mit der Pandemie nichts zu tun haben, richtet sich der Blick zunehmend auf RWD. So sind Zulassungsbehörden und Instanzen der Nutzenbewertung (Health Technology Assessment, HTA) an Real-World Evidence interessiert – nicht um randomisierte Studien zu ersetzen, sondern um sie dort, wo es für diese Methodik Grenzen gibt, sinnvoll zu ergänzen: RWD können beispielsweise in Situationen, in denen eine Randomisierung nicht möglich oder ethisch vertretbar ist, zur Generierung historischer Kontrollgruppen genutzt werden. Im Rahmen der Nutzenbewertung kann der Gemeinsame Bundesausschuss in bestimmten Konstellationen seit einiger Zeit anwendungsbegleitende Datenerhebungen anordnen, die die Daten des Nutzenbewertungsdossiers ergänzen, während das Medikament gleichzeitig bereits erstattet wird. Bisher betrifft das vor allem CAR-T-Zell-Therapien und Gentherapien, es ist aber nicht darauf beschränkt.
Auch Behörden, wie in Europa die Europäische Arzneimittel-Agentur (EMA), können Real-World Evidence bei der Zulassung berücksichtigen oder eine entsprechende Datenerhebung im Anschluss an eine Zulassung verlangen. Das wird unter anderem bei beschleunigten Zulassungsverfahren und auch bei Zulassungen von Medikamenten für Seltene Erkrankungen genutzt.
Schließlich sorgt auch noch die zunehmende Digitalisierung der medizinischen Versorgung für Rückenwind in der RWD-Forschung. Erstens stehen durch die Digitalisierung immer mehr mit überschaubarem Aufwand auswertbare Daten zur Verfügung. Zum anderen ermöglichen KI-Werkzeuge eine umfassendere und effizientere Auswertung solcher Daten. Ablesen lässt sich das gewachsene Interesse an der RWD-Forschung unter anderem an der Zahl der medizinischen Fachpublikation zum Thema. Ein Beispiel: In der Datenbank PubMed hat sich die Zahl der Publikationen, die als Stichwort „Real World Data“ angeben, seit 2010 verachtzehnfacht, auf zuletzt knapp 10 000 in einem Jahr. Wie groß die Bedeutung ist, die diesem Thema weltweit beigemessen wird, zeigt sich nicht zuletzt in den USA. Hier wurde bereits 2016 im 21st Cures Act der Boden für eine regulatorische RWD-Nutzung bereitet, und schon 2018 hat die US-Zulassungsbehörde FDA einen entsprechenden regulatorischen Rahmen vorgelegt.
Chancen und Grenzen von Routinedaten
Was können Routinedaten, was kann Real-World Evidence leisten, und was nicht? Wie viel Hype steckt in dem Thema, und wie viel echter Fortschritt? In der Forscher-Community ist eine intensive Diskussion entbrannt, die noch längst nicht abgeschlossen ist. Dass RWD in vielen Kontexten extrem hilfreich sein kann, ist aber unstrittig. Klassische Forschungsszenarien für RWD sind:
- seltene oder sehr langfristige Nebenwirkungen von Arzneimitteln,
- regionale Unterschiede in der medizinischen Versorgung bei unterschiedlichsten Erkrankungen,
- regionale Unterschiede in der Krankheitslast und in der Prognose von Erkrankungen oder auch
- die Bewertung der Effektivität von Therapien in Patientengruppen, die von den jeweiligen Zulassungsstudien nicht erfasst wurden oder die in randomisierten Studien generell schlecht erfassbar sind.
Die beiden großen Herausforderungen bei der RWD-Forschung sind Datenqualität und Bias. Viele RWD-Datensätze haben Qualitätsprobleme, und häufig gibt es einen Bias aufgrund der Art und Weise, wie Datensätze zustande gekommen sind. Dieser kann zu Fehlinterpretationen führen, wenn er nicht adäquat berücksichtigt wird. Dr. Beate Wieseler vom Ressort Arzneimittelbewertung des Instituts für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG) sieht vor diesem Hintergrund den Einsatz von RWD im Kontext der Nutzenbewertung beispielsweise eher kritisch, wie sie kürzlich in einem viel diskutierten Beitrag für das British Medical Journal erläuterte.1
Illustrieren lassen sich die Probleme von RWD anhand der in der Versorgungsforschung sehr beliebten Abrechnungsdaten. Sie enthalten keine Angaben zu medizinischen Verläufen. Sie bilden nur oder weit überwiegend das ab, was auch codierbar ist und erstattet wird. Und sie sind anfällig für Verzerrungen durch Abrechnungsbetrug oder Codierungsbesonderheiten im jeweiligen Gesundheitssystem. Die Prävalenz von Long COVID beispielsweise war durch die Analyse von Abrechnungsdaten anfangs kaum zu erfassen, weil die Erkrankung weder spezifisch codierbar war noch spezifische Therapien existierten, die einen indirekten Rückschluss erlaubt hätten. Die COVID-Pandemie lieferte auch noch ein anderes Beispiel für die Grenzen von RWD: Durch Analysen auf Basis elektronischer Patientenakten in den USA wurde die durchschnittliche Gefährlichkeit einer COVID-Infektion lange Zeit deutlich überschätzt – unter anderem weil in diesen Datenbanken Menschen mit hohem Risiko überrepräsentiert sind.
Interview: „Abrechnungsdaten fehlt die medizinische Tiefe“
Deutschland soll bei der Forschung mit Routinedaten vorankommen. Der Versorgungsforscher Ingo Meyer sieht das Land auf dem richtigen Weg. Er plädiert aber auch für Vielfalt statt Monokultur bei den Datenquellen.
RWD-Forschung made in Arztpraxis
Gerade das letztgenannte Beispiel macht deutlich, warum das Thema RWD auch in der ambulanten Versorgung relevant ist. Pragmatische, randomisierte Studien kommen deswegen oft aus Großbritannien, weil der dortige National Health Service (NHS) die Hausarztpraxen digital vernetzt. Und gleichzeitig wird bei den britischen GPs (General Practitioners) überwiegend digital und in weiten Teilen einheitlich dokumentiert. Dadurch können für Studien geeignete Patientinnen und Patienten rasch identifiziert und Forschungsdatensätze ohne massiven Zusatzaufwand für die beteiligten Praxen zusammengestellt und ausgewertet werden.
Für Dr. Alexander Schachinger, Real-World-Data-Spezialist bei ¬medatixx, kommt keine andere Datenquelle im Gesundheitswesen an die ambulante Versorgung heran: „Nirgendwo sind die Versorgungsdaten in dieser Tiefe so vollständig vorhanden. Wenn wir diese Daten besser zugänglich machen, dann können wir die Gesundheitsversorgung enorm verbessern.“ Dass das im Rahmen der regulatorischen Rahmenbedingungen geschehen muss, die in Europa die Datenschutz-Grundverordnung (DSGVO) und in Deutschland die nationale Datenschutzgesetzgebung setzen, versteht sich von selbst.
DSGVO und nationales Recht setzen den Rahmen
Ein weit verbreiteter Irrtum ist, dass die DSGVO für die Forschung mit Gesundheitsdaten zwingend eine aktive Einwilligung verlangt. Dem ist nicht so. Vielmehr öffnen die DSGVO und das deutsche Gesundheitsdatennutzungsgesetz (GDNG) explizit die Türen für eine einwilligungsfreie Forschung – für die freilich viele Leitplanken eingehalten werden müssen. Eine solche einwilligungsfreie Nutzung von Gesundheitsdaten unter Beachtung aller Datenschutzanforderungen wird in vielen EU-Ländern genutzt. Auch pragmatische Opt-out-Ansätze sind sehr gängig. Dabei wird eine Zustimmung zur Forschung als erteilt angesehen, solange nicht aktiv widersprochen wird.
Deutschland will diese Forschung ausbauen. Der Weg führt über eine Vielzahl ineinandergreifender Maßnahmen, die dafür sorgen, dass die auswertenden Forscherinnen und Forscher oder auch die an RWD-Analysen interessierten Unternehmen keinerlei Zugriff auf personenidentifizierende Daten haben. Diese Maßnahmen sind sowohl organisatorischer als auch technischer Natur. Kernkomponenten sind unter anderem eine sichere Verarbeitungsumgebung, externe Datentreuhänder und eine starke Pseudonymisierung oder, je nach Fragestellung, Anonymisierung der Daten. Natürlich müssen auch die zuständigen Datenschutzbeauftragten zustimmen. Dass eine regulierte und datensichere Versorgungsforschung nicht nur politisch gewollt, sondern auch von den Bürgerinnen und Bürgern begrüßt wird, zeigt eine im Frühsommer 2024 vorgelegte Umfrage, die von der Technik- und Methodenplattform für die vernetzte medizinische Forschung (TMF e.V.) bei dem Meinungsforschungsinstitut Forsa beauftragt wurde. In dieser bevölkerungsrepräsentativen Umfrage befürworteten 86 Prozent der rund 3 000 Befragten eine einwilligungsfreie Nutzung von Gesundheitsdaten für öffentlich geförderte Forschungsvorhaben. Zwei Drittel befürworteten das auch für die privatwirtschaftliche Forschung, zum Beispiel durch Arzneimittelhersteller.
Hybride Dokumentation erleichtert Studien
Unstrittig ist, dass der mit der RWD-Forschung einhergehende Trend zu einer strukturierte(re)n digitalen Dokumentation hilfreich ist. Denn diese kann eben nicht nur für die RWD-Forschung genutzt werden, sondern sie kann zusätzlich kontrollierte Studien erleichtern. Auch hier lieferte die Pandemie Anschauungsmaterial: Die Länder mit gut ausgebauter RWD-Infrastruktur waren auch jene Länder, die bei den prospektiven COVID-Studien die Nase vorn hatten.
Erleichtert werden durch eine hybride – also sowohl für die Versorgung genutzte als auch für die Forschung zugängliche – Dokumentation insbesondere pragmatische randomisierte Studien. Dabei werden Studienzentren auf Basis von Daten aus elektronischen Aktensystemen identifiziert und randomisiert, was schnell geht und kostengünstig ist. Das Paradebeispiel dafür war schon einige Jahre vor der Pandemie die ADAPTABLE-Studie, die in den USA 450 000 Patientinnen und Patienten mit bekannter kardiovaskulärer Erkrankung identifizierte, von denen am Ende 15 000 an 40 Zentren für die Studie rekrutiert wurden. Randomisiert zu zwei unterschiedlichen Aspirin-Dosierungen wurden die Zentren, nicht die einzelnen Teilnehmerinnen und Teilnehmer. Die Kosten dieser Studie betrugen geschätzt 20 bis 50 Prozent dessen, was eine konventionell randomisierte Studie zur selben Frage gekostet hätte.2
Fazit
Die Forschung mit realen Versorgungsdaten kann wertvolle Erkenntnisse zur medizinischen Versorgung liefern, die die Ergebnisse randomisierter Studien ergänzen. Die reine Sekundärnutzung von Abrechnungsdaten wird dabei zunehmend ergänzt um eine datenschutzkonforme Analyse primärer, also in medizinischen Einrichtungen dokumentierter Versorgungsdaten, die gerade auch im Public-Health-Kontext oft nützlicher sind als Abrechnungsdaten. Primärdaten erlauben es, stärker in die medizinische Tiefe zu gehen, und sie sind auch oft geeigneter für Datennutzung, die über die unmittelbare Forschung hinausgeht – etwa im Zusammenhang mit dem Training von KI-Algorithmen. Während Primärdaten von Krankenhäusern bereits in großem Umfang zugänglich gemacht werden, gibt es bei der Forschung mit ambulanten Routinedaten noch Nachholbedarf.
So macht es medatixx
Um die ambulanten Versorgungsdaten besser für die Forschung zugänglich zu machen, hat medatixx schon 2022 das Projekt x.panel für die Praxissoftwarelösungen des Unternehmens entwickelt. Über x.panel werden Versorgungsdaten der Praxis anonymisiert für die Forschung aufbereitet. Bereits lokal in der Praxissoftware werden die Daten anonymisiert. Die anonymisierten Daten werden erst dann in einer sicheren Umgebung zusammengeführt, wenn individuell festgelegte Schwellenwerte für die insoweit relevanten Parameter erreicht sind. Forschen dürfen mit den Daten all jene, die ein legitimes Interesse an Versorgungsforschung haben: Universitäten, Forschungsinstitute, die forschende Industrie und zum Beispiel auch KI-Start-ups. Für den Datenzugriff ist eine aktive Freischaltung durch medatixx erforderlich. Ziel von x.panel ist es, einen möglichst repräsentativen Querschnitt der Versorgung abzubilden. Alle Fachrichtungen können an x.panel teilnehmen, über 2.200 Ärztinnen und Ärzte machen aktuell davon bereits Gebrauch. Insgesamt wird so der Zugriff auf strukturierte Datenfelder und Variablen von derzeit rund 2,5 Millionen Patientenfällen ermöglicht. Als Aufwandsentschädigung für die anonymisierte Datenbereitstellung erhalten die Praxen für ihre Teilnahme eine Reduktion ihrer monatlichen Softwarepflegegebühr. In Sachen Einwilligung wird ein für die Praxen unkomplizierter Opt-out-Ansatz genutzt, der alle rechtlichen Anforderungen in Deutschland und Europa erfüllt. Praxen, die sich für eine Teilnahme entscheiden, sind verpflichtet, ihre Patientinnen und Patienten darüber zu informieren. Es gibt ein individuelles Widerspruchsrecht, das medatixx sehr ernst nimmt: Patientendaten werden von den Praxen erst dann übermittelt, wenn die Patienten in der Praxis waren, sich über x.panel und ihre Rechte informieren konnten und nicht widersprochen haben. medatixx unterstützt die Praxen dabei mit Textbausteinen zum Zwecke der Patienteninformation.
1 BMJ 2023; 380:e073100
2 Liu F, Panagiotakos D; BMC Medical Research Methodology 2022; 22(1):287
Hier können Sie sich die gesamte x.press-Ausgabe 25.1 herunterladen.