World Health Summit: Von Gesundheitsclouds, IDs, "Record Linkage" und Co.

Um die Forschung mit KI-Methoden im Gesundheitsbereich voranzubringen, fordern Experten des World Health Summits eine bessere Verknüpfung von Gesundheitsdaten.

In Pocket speichern vorlesen Druckansicht 3 Kommentare lesen
Person mit einem grünen T-Shirt trägt eine VR-Brille und guckt auf die Projektion einer medizinischen Zeichnung eines Menschen.

(Bild: thinkhubstudio/Shutterstock.com)

Lesezeit: 5 Min.
Inhaltsverzeichnis

KI und Robotik tragen maßgeblich dazu bei, "die Wirksamkeit, Widerstandsfähigkeit und Nachhaltigkeit der Gesundheitssysteme zu erhöhen und Ungleichheiten in der Gesundheitsversorgung zu verringern". Das sagte Professorin Petra Ritter, Leiterin der Sektion Gehirnsimulation an der Charité, in der Panel-Diskussion "Global Health AI and Robotics" auf dem World Health Summit. Schwerpunkte der Diskussion waren einerseits der Zugang zu Gesundheitsdaten und andererseits die Vertrauenswürdigkeit neuartiger KI- und Robotiktechnologien.

Dabei sei vor allem der Zugriff auf Gesundheitsdaten wichtig. Die Charité und das Berliner Institut für Gesundheitswissenschaften haben dafür eine Cloud-Infrastruktur für Gesundheitsdaten entwickelt und sehen sich damit als Vorreiter für den europäischen Gesundheitsdatenraum (European Health Data Space, EHDS). Doch auch von den in der kommenden KI-Verordnung erwähnten "Regulatory Sandboxes" war dabei die Rede.

Eine zentrale Rolle für den EHDS soll die 2020 ins Leben gerufene nationale Forschungsdateninfrastruktur "NFDI4Health" spielen. Für den Einsatz von KI im Gesundheitswesen werden Gesundheitsdaten benötigt, die die Forschungsdateninfrastruktur bereitstellen will. Dafür wolle man "den Wert der Forschung für KI steigern", etwa in der Epidemiologie, im öffentlichen Gesundheitswesen und in klinischen Studien. Das erklärte Professorin Juliane Fluck, stellvertretende wissenschaftliche Leitung des Infrastruktur- und Forschungszentrums für lebenswissenschaftliche Daten und Informationen (ZB MED), die sich vor allem um die nationale Forschungsdateninfrastruktur und damit die Koordination des Konsortiums NFDI4Health kümmert. Aktuell laufen die Vorbereitungen für den EHDS.

Zunächst veröffentlichen datenhaltende Organisationen Forschungsdaten. Forscher finden relevante Datensätze und wählen die für ihr Forschungsprojekt benötigten Variablen aus. Anschließend erfolgt eine Anfrage zur Nutzung der Datensätze. Das "Use and Access Committee (UAC)" entscheidet und Entscheidung des Nutzungs- und Zugangsausschusses wird kommuniziert. Es folgen unter anderem Vertragsverhandlungen, die Wiederverwendung von Daten, der Datentransfer und die verteilte Datenanalyse.

Die Daten sollen dabei nach den FAIR-Prinzipien – Findable, Accessible, Interoperable, Reusable – zugänglich gemacht werden. Der Ansatz sei dabei Bottom-up, aktuell habe man 26 verschiedene NFDIs in verschiedenen Wissenschaftsbereichen. Künftig sollen diese für den Aufbau der Forschungsdateninfrastruktur vernetzt werden, um ein standardisiertes Forschungsdatenmanagement zu etablieren, das mit vielen verschiedenen Initiativen auf "nationaler und internationaler Ebene" verknüpft wird. Dabei will man Daten aus verschiedenen Bereichen kombinieren – strukturierte Daten sollen dabei aus Registern, Versicherungsdaten, aber auch vor allem aus "hochwertigen Studiendaten und öffentlichen Gesundheitsdaten" kommen.

Übersicht der deutschen Gesundheitsforschungsinfrastrukturen

(Bild: Juliane Fluck)

Für die Daten aus den Krankenkassen ist beispielsweise das Bundesinstitut für Arzneimittel und Medizinprodukte zuständig. Ebenso gibt es eine Reihe von Gesundheitsregisterdaten, etwa die Krebsregister. Ein medizinisches Register der Informatik Initiative dient der Einrichtung von Datenintegrationszentren in Universitätskliniken, für den Zugang zu Gesundheitsdaten. Aktuell gebe es eine vielfältige Landschaft von Gesundheitsdaten, auch EU-weit.

Pläne des NFDI4Health

Um den Zugang zu den Daten zu ermöglichen, braucht es unter anderem ein allgemein akzeptiertes Schema für Metadaten und gemeinsame Schnittstellen für die Veröffentlichung von Studiendaten und Anfragen für die Datennutzung. Ebenso müssen die Daten kuratiert und Trainingsdaten wie Textkorpora, Bilder und synthetische Daten generiert werden.

Bei NFDI4Health sollen in den Datenhaltungsorganisationen verteilte Datenanalyse-Clients aufgebaut werden, um verteilte Analysen zu ermöglichen. Unter anderem gebe es auch ein Transparenzportal, bei dem zu sehen ist, "was für ein Projekt mit bestimmten Daten gemacht wurde".

Auf eine Nachfrage vom Publikum zur Möglichkeit der Anonymisierung der Daten antwortete Ritter, dass das Arbeiten mit nicht anonymisierten Daten wichtig sei. Beispielsweise könnten biometrische Informationen wie Hirn-Scans immer identifiziert werden. Bei der US-Biomedizinbehörde "National Institute of Health" würden Datensätze für die biomedizinische Forschung beispielsweise umfassend verknüpft. Daher hat NFDI4Health ein Whitepaper zur "Verbesserung des Record Linkage für die Gesundheitsforschung in Deutschland" veröffentlicht.

Dabei bedeutet Record Linkage "die individuelle Verknüpfung von unterschiedlichen Gesundheitsdaten mit dem Ziel, einen gemeinsamen Datensatz zu erstellen". Künftig sollen dabei Forschungsinstitute, Krebsregister, Krankenhäuser oder Krankenversicherungen "Gesundheitsdaten zu ein und derselben Person erfassen, aber wenn diese verschiedenen Datensätze einer Person nicht miteinander verknüpft werden können, müssen wichtige Forschungsfragen unbeantwortet bleiben", erklärt Prof. Dr. Wolfgang Ahrens. Er ist Leiter der Abteilung Epidemiologische Methoden und Ursachenforschung am Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS.

"Erst durch die Verknüpfung von unterschiedlichen Datenquellen lassen sich wissenschaftliche Fragestellungen beantworten, die wegen des beschränkten Variablenumfangs mit einer Datenquelle alleine nicht zu beantworten wären. [...] Da es sich bei diesen Gesundheitsdaten um sensible Daten handelt, sind sie durch strenge Rechtsvorschriften gegen potenziellen Missbrauch geschützt", so Ahrens. Ebenso fordern die Teilnehmer des Panels eine einheitliche Identifikationsnummer, da diese die "Zusammenführung von Gesundheitsinformationen über verschiedene Datenkörper hinweg ermöglichen würde, ohne dass Identitätsdaten wie Name und Adresse übermittelt werden müssten". Das erklärt Sebastian C. Semler, Geschäftsführer der Technologie- und Methodenplattform für die vernetzte medizinische Forschung (TMF e.V.).

Anlässlich des WHS fordern auch die Mitglieder des Global Health Hub Germany in einem "Policy Brief", dass Deutschland eine weltweite Vorbildrolle beim Umgang mit Gesundheitsdaten einnehmen soll. Dabei habe sich Deutschland bereits stark für den Datenschutz eingesetzt. Daher werde ein stärkerer rechtebasierter Ansatz bei der Nutzung von Gesundheitsdaten gefordert. Für die Stärkung eigener Datenschutzregeln solle Deutschland den Partnerländern Unterstützung anbieten und mit zivilgesellschaftlichen Gruppen für die Umsetzung der Datenschutzregeln vor Ort sorgen.

(mack)