Eine schweizerisch-malawische Partnerschaft

Gemeinsame Nutzung von Daten und Schutz der Privatsphäre in Ländern mit niedrigem und mittlerem Einkommen

"In der Schweiz gibt es kein System für den Austausch offener Daten in den Gesundheitswissenschaften", sagt der Statistiker Matthias Templ von der Zürcher Hochschule für Angewandte Wissenschaften (ZHAW). "Es wird hier grundsätzlich nicht praktiziert, aber es wird von Forschern in Malawi gemacht. Und ich denke, wir können von ihnen lernen."

Veröffentlicht: 01.06.2021, Autor: Jeannie Wurz

Die gemeinsame Nutzung und der Schutz von Daten ist für Einzelpersonen, Unternehmen, NGOs, Firmen und Länder auf der ganzen Welt zu einem heissen Thema geworden. Ein Start-up Zuschuss über 10.000 CHF von ESTHER Switzerland unterstützt eine Zusammenarbeit zwischen der Malawi Epidemiology and Intervention Research Unit (MEIRU) in Malawi und der Zürcher Hochschule für Angewandte Wissenschaften (ZHAW) in der Schweiz. Die Partnerschaft wird in Malawi von dem Datendokumentalisten Chifundo Kanjala und in Zürich von Matthias Templ geleitet.

MEIRU ist eine malawische NGO, die Forschung zur Bevölkerungsgesundheit in städtischen und ländlichen Gebieten Malawis durchführt. MEIRU-Studien werden von der Malawi National Commission for Science and Technology reguliert, und für jedes Forschungsprojekt wird eine ethische Genehmigung eingeholt. In der Ethikgenehmigung sind die Bedingungen für die gemeinsame Nutzung von Daten festgelegt.

Die Partner

Ziel des sechsmonatigen Projekts ist es, die Methoden zur Anonymisierung von Gesundheits- und demografischen Daten zu verbessern, die in Ländern mit niedrigem Einkommen erhoben werden. Die Partnerschaft kam zustande, als Kanjala MEIRU-Datensätze für die gemeinsame Nutzung vorbereitete.

"Ich ging auf die Website des International Household Survey Network, um nach Ressourcen zur Vorbereitung von Daten für die gemeinsame Nutzung zu suchen, und ich fand einige Informationen, die eine Software beschrieben, die Matthias und andere für die Anonymisierung von Daten vorbereitet hatten, genannt sdcMicro. Damit konnte ich anfangen. Aber ich stiess schnell auf Fragen, auf die ich nicht so einfach Antworten finden konnte, und so schrieb ich eine E-Mail an Matthias, und wir begannen zu korrespondieren."

Templ ist der Autor des Buches Statistical Disclosure Control for Microdata: Methoden und Anwendungen in R, das 2017 erschienen ist. "Es gab bereits einige Bücher, aber keines, das die Methoden mathematisch erklärt und auch einige Softwareanwendungen bietet", sagt er. "Ich habe versucht, eine theoretische Grundlage zu geben, aber auch in praktischen Beispielen mit Software zu zeigen, wie die Methoden funktionieren." 

Das Projekt

Die anfängliche E-Mail-Korrespondenz führte zu einem gemeinsamen Projekt, das die Kapazitäten im Bereich der ethischen Weitergabe von in Malawi produzierten Daten stärken sollte, wobei MEIRU-Daten als Prototyp verwendet wurden. Kanjala und Templ nannten ihr Projekt "Better De-Identification Using Statistical Anonymisation (BISA) for Malawi Population Health Data". Als Akronym für das Projekt wählte Kanjala BISA, was in Chichewa, der Landessprache Malawis, "verstecken" bedeutet. "Ich habe es gewählt, weil man bei der De-Identifizierung versucht, die Identitäten der Menschen zu verbergen", sagt er.

Die Zusammenarbeit umfasst die Erstellung einer Vorlage für die Anonymisierung von Daten, die aus den Forschungsgruppen für Gesundheit und demografische Überwachung und Bevölkerungsgesundheit stammen. Laut Kanjala bringt dies einen unmittelbaren Nutzen für MEIRU, da die Forscher sicher sein können, dass sie Daten weitergeben, die ordnungsgemäss anonymisiert sind und internationalen Standards entsprechen.

Laut Templs Buch sind die Nachfrage nach und der Umfang von Daten aus Umfragen, Registern oder anderen Quellen, die sensible Informationen über Personen oder Unternehmen enthalten, in den letzten Jahren deutlich gestiegen. Gleichzeitig haben Datenschutzprinzipien und -vorschriften den Zugang zu und die Nutzung von individuellen Daten eingeschränkt. 

Warum Daten teilen?

Es hat Vorteile, Daten gemeinsam zu nutzen, sagt Kanjala. "Es ist eine effiziente Nutzung von Ressourcen, weil die zweite Person die Daten nicht noch einmal sammeln muss." Transparenz in der Wissenschaft ist ein weiteres sehr wichtiges Thema. "Es ist gute Wissenschaft, Daten zu teilen. Die andere Person kann verifizieren, was ich gemacht habe", sagt Kanjala. "Sonst könnte ich meine Ergebnisse einfach veröffentlichen. Wenn ich meine Daten teile, kann jemand bestätigen oder widerlegen, was ich behauptet habe."

"Es ist eine gute Wissenschaft, Daten zu teilen. Die andere Person kann verifizieren, was ich gemacht habe."

Chifundo Kanjala

Forschungsförderer verlangen zunehmend, dass Daten gemeinsam genutzt werden. Obwohl die gemeinsame Nutzung von Daten für den Fortschritt der Wissenschaft und den maximalen Nutzen aus der Finanzierung von grossem Wert ist, sagen die Partner, dass "eines der Hauptanliegen die Wahrung der Vertraulichkeit der Studienteilnehmer ist."

Im Jahr 2016 haben Interessenvertreter aus Wissenschaft, Industrie, Förderorganisationen und dem wissenschaftlichen Verlagswesen in der Open-Access-Zeitschrift "Scientific Data" die "FAIR Guiding Principles for scientific data management and stewardship" erstellt und befürwortet, die fordern, dass Forschungsdaten auffindbar, zugänglich, interoperabel und wiederverwendbar (Findable, Accessible, Interoperable and Reusable = FAIR) sein sollen.

Im Laufe eines Jahrzehnts haben die Erwartungen der Geldgeber dazu geführt, dass mehr Wert auf die Anonymisierung von Daten gelegt wird, sagt Kanjala. "Wir sind über die Arbeit innerhalb unserer kleinen Gruppe von Forschern oder mit engen Mitarbeitern hinausgegangen. Heute teilen wir die Daten, die wir produzieren, mit einer grösseren Gruppe von Forschern. Sie kennen sie vielleicht gar nicht. Sie sind sich nicht bewusst, wer Ihre Daten tatsächlich nutzt und wer nicht. Sie wollen also die Anonymisierung der Daten so stark wie möglich machen."

Wachsendes Interesse am Datenschutz

Das Kernkonzept der Datenanonymisierung besteht darin, Daten so zu transformieren, dass das Re-Identifikationsrisiko für Personen im Datensatz reduziert wird. "In der Statistik wollen wir etwas über eine Gruppe von Menschen aussagen", sagt Templ. "Das Ziel ist nicht, eine bestimmte Person zu analysieren. Wir wollen einige allgemeine Indikatoren über den Gesundheitszustand analysieren, zum Beispiel aus der Bevölkerung."

Datenschutzskandale in den 90er Jahren haben deutlich gemacht, dass das Entfernen oder Pseudoanonymisieren von direkt identifizierenden Merkmalen wie Namen, Adressen und Sozialversicherungsnummern in der Regel nicht ausreicht, um Datenschutzverletzungen zu verhindern.

Im Mai 2016 verabschiedete die Europäische Union ein umfassendes neues Datenschutzrecht, das den "Schutz natürlicher Personen bei der Verarbeitung personenbezogener Daten und den freien Verkehr solcher Daten" regelt. Die General Data Protection Regulation (GDPR) ist im Mai 2018 in Kraft getreten.

In der Schweiz wurde unterdessen im Herbst 2020 das revidierte Bundesgesetz über den Datenschutz (DSG) vom Parlament verabschiedet und wird voraussichtlich Mitte 2022 in Kraft treten. Das neue DSG soll unter anderem die Rechte der Bürger auf Datenschutz und Privatsphäre stärken und längerfristig sichern.

Unterschiede in der Datenerfassung

Malawi - ein Land mit niedrigem Einkommen - hat nicht die Ressourcen, um den Zugang zu Gesundheitsdaten für jeden zu organisieren, der forschen möchte, sagt Chifundo Kanjala. Richtlinien und Open-Source-Tools, wie sie im BISA-Projekt implementiert wurden, können die Barriere für den Austausch von Gesundheitsdaten auf individueller Ebene für Forschung und Entscheidungsunterstützung senken.

Kanjala arbeitet in einem Team von Datenbankprogrammierern und Datenwissenschaftlern, die die Sammlung, Validierung, Verarbeitung und Integration von Daten verwalten, die Forscher dann analysieren können, um Politik und Entscheidungsfindung zu verstehen und zu unterstützen. Die bevölkerungsbasierten Forschungskohorten, mit denen sie arbeiten, produzieren sehr komplizierte Daten, sagt Kanjala, und die Vorbereitung dieser Daten für die Analyse durch die Forscher erfordert ein Team.

"Wenn Sie eine Querschnittsumfrage machen", sagt er, "befragen Sie die Leute nur ein einziges Mal. Man erhält seine Informationen und daraus einen Datensatz. Aber bei den Bevölkerungskohorten, mit denen wir arbeiten, werden die Studienteilnehmer über einen längeren Zeitraum hinweg beobachtet. Sie kehren also immer wieder zur Bevölkerung zurück. Man versucht, die Daten über die Zeit zu verknüpfen."

Datenverarbeitung
Datenverarbeitung

Es gibt weitere Unterschiede in der Art und Weise, wie Gesundheitsforschungsdaten in Entwicklungsländern erhoben werden, sagt Kanjala. "Nicht jeder ist des Lesens und Schreibens kundig. Sie können nicht einen Fragebogen online stellen und erwarten, dass jemand im ländlichen Malawi ihn ausfüllt und an Sie zurückschickt. Oft wird man Interviewer*in schicken müssen, die sich mit den Teilnehmer*innen der Studie zusammensetzen und mit ihnen sprechen (siehe Titelfoto des Interviewers im blauen Hemd mit Teilnehmer). Man wird eine Person brauchen, die das Interview in der jeweiligen Landessprache führt, und dann muss sie es ins Englische übersetzen."

Vorteile der ESTHER-Partnerschaft 

Im Gegensatz zur Situation in vielen Ländern mit niedrigem und mittlerem Einkommen in Afrika hat MEIRU Zugang zu einer reichhaltigen Quelle von Gesundheitsforschungsdaten, die in einem ländlichen Gebiet Malawis über einen Zeitraum von mehr als 30 Jahren gesammelt wurden, sowie zu einem städtischen Forschungsstandort in der Hauptstadt, der seit 2013 besteht. Es betreibt ein Gesundheits- und demografisches Überwachungssystem, das Feld- und Rechenverfahren zur Erfassung von Daten zu Demografie, Gesundheitsrisiken, Exposition und Gesundheitszustände kombiniert. Die Ergebnisse werden verwendet, um den nationalen und regionalen Dialog über die Aufbereitung offener Daten in einer Weise zu informieren, die die Vertraulichkeit und Privatsphäre derjenigen berücksichtigt, die der Teilnahme an Forschungsstudien zugestimmt haben.

"Unser ESTHER-Projekt ist das erste, das darüber nachdenkt, wie wir Gesundheitsforschungsdaten in der Schweiz teilen können."

Matthias Templ

Derzeit, so der Projektvorschlag, ist das wichtige Thema des Schutzes von Gesundheitsdaten nicht ausreichend erforscht, in Entwicklungsländern im Allgemeinen und im Gesundheits- und demografischen Überwachungssystem im Besonderen. Gesundheits- und demografische Überwachungssysteme tauschen derzeit Daten aus, ohne dass klar ist, wie hoch das Risiko ist, dass die Identität von Personen in einem Datensatz offengelegt werden könnte.

Die Schweiz ist weit hinter Malawi zurück, was die gemeinsame Nutzung von Open-Data in den Gesundheitswissenschaften angeht, sagt Matthias Templ. "Unser ESTHER-Projekt ist das erste, das darüber nachdenkt, wie wir Gesundheitsforschungsdaten in der Schweiz teilen können."

Die Partner erwarten, dass das Interesse an den Ergebnissen des ESTHER-Projekts groß sein wird. "Viele Länder werden sich anschauen, was wir im Bereich der Anonymisierung und der gemeinsamen Nutzung von Gesundheitsdaten tun", sagt Templ. "Viele Leute warten auf das Ergebnis."

Das Gesundheits- und demografische Überwachungssystem und medizinisch-wissenschaftliche Forschungsgemeinschaften in den Entwicklungsländern werden die primären Nutzniesser der resultierenden Publikationen und Software sein, aber die Ergebnisse werden für jeden nützlich sein, der an der Anonymisierung von Längsschnittdatensätzen zum Zwecke der gemeinsamen Nutzung arbeitet, sagt Templ.

Nächste Schritte

Die Partnerschaft begann mit einem ESTHER-Startup-Zuschuss, und nun überlegen Kanjala und Templ, wie es weitergehen soll. Um Datenmanagern und Datenwissenschaftlern einen Überblick über die Problematik zu geben, haben sie Ende April 2021 ein vierstündiges Webinar veranstaltet. Daran nahmen Datenspezialisten aus Malawi, Südafrika und benachbarten Ländern teil.

Traditionell kam immer jemand von einer Universität in einem Land mit hohem Einkommen, um die Analyse der Daten in Nord-Süd-Gesundheitsforschungspartnerschaften zu leiten, sagt Kanjala. Aber es gibt mehr und mehr etablierte afrikanische Forscher, die Gruppen in Entwicklungsländern leiten. "Die Landschaft verändert sich", sagt er, "aber das braucht Zeit."

Die Forscher sind auf einem guten Weg. "Unsere Partnerschaft ist ein Beispiel dafür, dass die gemeinsame Nutzung von Daten sehr gut funktioniert", sagt Templ. "Chifundo nutzte die Software, weil er sie nutzen konnte, weil sie quelloffen und kostenlos ist, und das führte zu unserer internationalen Zusammenarbeit. Das ist die Erfolgsgeschichte der offenen Forschung."