Titel: Privacy-aware Artificial Intelligence in Systems Medicine
Sprache: Englisch
Autor*in: Matschinske, Julian Oskar
Schlagwörter: Federated Learning; Privacy-enhancing Technologies; Drug Repurposing; Network Medicine; Network Algorithms
GND-Schlagwörter: Verteilte künstliche IntelligenzGND
Verteilte künstliche IntelligenzGND
Maschinelles LernenGND
SystemmedizinGND
AnonymisierungGND
Erscheinungsdatum: 2023-10-08
Tag der mündlichen Prüfung: 2024-02-14
Zusammenfassung: 
Bioinformatics is grappling with an explosion of data, creating both opportunities and challenges for scientific discovery and healthcare. This thesis stands at the crossroads of systems medicine and privacy-aware artificial intelligence (AI), offering contributions that aim to harness the potential of this data-rich landscape. Central to the thesis are the web tools CoVex, sPLINK, FeatureCloud, and AIMe, each designed to address unique challenges, publicly and freely available to the research community.

Within the ambit of systems medicine, CoVex emerges as a tool in the realm of infectious diseases and drug repurposing. Deploying network exploration and ranking algorithms like centrality measures, CoVex identifies intricate disease pathways and potential drug targets. Its purpose mainly lies in drug repurposing achieved by its capability to explore integrated virus-protein, protein-protein and protein-drug interaction networks to identify alternative applications for existing drugs, thereby accelerating the medical response to urgent challenges like the COVID-19 pandemic.

Privacy-aware AI is the second major pillar of the thesis, with a focus on federated learning (FL) as an enabling technology. The tools sPLINK and FeatureCloud are introduced to demonstrate this approach. sPLINK, specialized for genome-wide association studies (GWAS), preserves data privacy without compromising analytical robustness. FeatureCloud expands upon this by serving as a versatile, FL platform, thereby facilitating large-scale analyses across multiple institutions while adhering to stringent data privacy norms. It employs and integrates state-of-the-art privacy-enhancing techniques (PETs), such as differential privacy (DP) and secure multiparty computation (SMPC), to protect sensitive patient data. Evaluation of FeatureCloud shows that the results are sufficiently close or even identical to centrally performed analyses, thereby demonstrating the efficacy and applicability of FL in a cross-silo context.

The thesis also brings forth the AIMe registry, aiming to create a foundation for transparency, reproducibility, and reliability in biomedical AI. By setting standards and ensuring correct and complete reporting, AIMe acts as a central hub for vetting and disseminating AI tools, increasing validation and reproducibility of results reported in biomedical research.

As we traverse an era defined by rapid data proliferation and stringent data protection laws, this thesis demonstrates that specialized tools and versatile platforms are valuable additions to the research landscape. CoVex, sPLINK, AIMe and FeatureCloud each have unique specializations, yet they all contribute to more efficient research in systems medicine: making integrated data quickly accessible to researchers, allowing large-scale analyses across distributed datasets, and ensuring valid and reproducible reporting of results.

Die Bioinformatik sieht sich einer Explosion von Daten gegenübergestellt, die neue Möglichkeiten aber auch Herausforderungen für wissenschaftliche Erkenntnisse und die Gesundheitsversorgung mit sich bringt. Diese Dissertation positioniert sich im Schnittbereich zwischen Systemmedizin und datenschutzbewusster künstlicher Intelligenz (KI) und erbringt Beiträge, die das Potential dieser datenreichen Umgebung erschließen sollen. Im Mittelpunkt stehen die Web-Tools CoVex, sPLINK, FeatureCloud und AIMe, die entwickelt wurden, um damit verbundene Herausforderungen zu bewältigen und die der Forschungsgemeinschaft öffentlich und frei zur Verfügung stehen.

Im Rahmen der Systemmedizin tritt CoVex als Werkzeug im Bereich der Infektionskrankheiten und der Medikamentenumwidmung in Erscheinung. Durch den Einsatz von Netzwerk-Erkundungs- und Ranking-Algorithmen, wie Zentralitätsmaßen, identifiziert CoVex komplexe Krankheitspfade und potenzielle neue Zielproteine für Medikamente. Der Hauptzweck liegt in der Medikamentenumwidmung, die mittels integrierter Virus-Protein-, Protein-Protein- und Protein-Medikament-Interaktionsnetzwerke alternative Anwendungen für bestehende Medikamente erkundet. Damit soll die Reaktion auf dringende Herausforderungen wie die COVID-19-Pandemie beschleunigt werden.

Datenschutzbewusste KI ist der zweite Hauptteil der Dissertation, wobei das föderierte Lernen (FL) als wesentliche Technologie im Fokus steht. Die Tools sPLINK und FeatureCloud werden vorgestellt, um diesen Ansatz zu demonstrieren. sPLINK, spezialisiert auf genomweite Assoziationsstudien (engl. GWAS), gewährleistet die Datensicherheit ohne Kompromisse bei der analytischen Robustheit einzugehen. FeatureCloud erweitert dieses Konzept, indem es als vielseitige Plattform für FL dient und so großangelegte Analysen über mehrere Institutionen hinweg ermöglicht, während es strengen Datenschutznormen gerecht wird. Es verwendet und integriert moderne Techniken zur Verbesserung der Privatsphäre, wie Differential-Privacy (DP) und Secure-Multiparty-Computation (SMPC), um sensible Patientendaten zu schützen. Die Evaluation von FeatureCloud zeigt, dass die Ergebnisse ausreichend nah oder sogar identisch mit zentral durchgeführten Analysen sind, wodurch die Wirksamkeit und Anwendbarkeit von FL im übergreifenden Kontext bestätigt wird.

Die Dissertation stellt auch das AIMe-Register vor, welches eine Grundlage für Transparenz, Reproduzierbarkeit und Zuverlässigkeit für biomedizinische KI schaffen soll. Durch das Definieren von Standards und die Sicherstellung korrekter und vollständiger Berichte fungiert AIMe als zentrale Datenbank zur Überprüfung und Veröffentlichung von KI-Tools, wodurch die Validierung und Reproduzierbarkeit von Ergebnissen in der biomedizinischen Forschung erhöht wird.

In einer Ära, die durch schnelle und fortschreitende Datenerzeugung und strenge Datenschutzgesetze geprägt ist, zeigt diese Dissertation, dass spezialisierte Tools und vielseitige Plattformen sinnvolle Ergänzungen in der Forschungslandschaft darstellen. CoVex, sPLINK, AIMe und FeatureCloud haben jeweils ihren eigenen Schwerpunkt, tragen jedoch alle dazu bei, die Forschung in der Systemmedizin effizienter zu gestalten: Sie machen integrierte Daten schnell für Forscherinnen und Forscher zugänglich, ermöglichen großangelegte Analysen über verteilte Datensätze hinweg und gewährleisten eine valide und reproduzierbare Dokumentation dieser Ergebnisse und ihrer Entstehung.
URL: https://ediss.sub.uni-hamburg.de/handle/ediss/10741
URN: urn:nbn:de:gbv:18-ediss-115605
Dokumenttyp: Dissertation
Betreuer*in: Baumbach, Jan
Enthalten in den Sammlungen:Elektronische Dissertationen und Habilitationen

Dateien zu dieser Ressource:
Datei Beschreibung Prüfsumme GrößeFormat  
Privacy_aware_AI_in_Systems_Medicine (5).pdf897fa9b7a67fe2947e132e979375217d8.04 MBAdobe PDFÖffnen/Anzeigen
Zur Langanzeige

Info

Seitenansichten

266
Letzte Woche
Letzten Monat
geprüft am 15.08.2024

Download(s)

178
Letzte Woche
Letzten Monat
geprüft am 15.08.2024
Werkzeuge

Google ScholarTM

Prüfe