Titel: Entwicklung einer Software zur Identifizierung neuartiger und bekannter Infektionserreger in klinischen Proben
Sonstige Titel: Development of a software for the identification of novel and known pathogens in clinical samples
Sprache: mehrsprachig
Autor*in: Alawi, Malik
Schlagwörter: Identifikation von Infektionserregern; Identification of infectious agents; Sequenzdatenanalyse; Sequence data analysis; Open Source Software
GND-Schlagwörter: Bioinformatik; Softwareentwicklung; Medizinische Mikrobiologie; Pathogener Mikroorganismus; Virusinfektion; Diagnostik
Erscheinungsdatum: 2020
Tag der mündlichen Prüfung: 2021-04-30
Zusammenfassung: 
Die Sequenzierung von diagnostischen Proben gilt als eine Schlüsseltechnologie, welche die Diagnostik von Infektionskrankheiten grundlegend verbessern kann. Mit diesem Ansatz können nicht nur Infektionserreger identifiziert werden, von denen bereits bekannt ist, dass sie mit einer bestimmten Krankheit assoziiert sind, sondern auch solche, welche bisher nicht mit dieser Krankheit in Verbindung gebracht wurden. Zudem ist der Ansatz geeignet vollständig unbekannte Infektionserreger zu identifizieren. Er kann daher dazu beitragen, zukünftigen Ausbrüchen neuartiger Infektionserreger besser vorbereitet zu begegnen.

Diese Studie beschreibt die Entwicklung und Anwendung von Methoden für die Identifizierung von Infektionserregern in diagnostischen Proben. Die Methoden wurden mehrfach erfolgreich unter klinischen Bedingungen eingesetzt und die entsprechenden Ergebnisse wurden im Rahmen dieser Doktorarbeit publiziert.
Die entwickelten Methoden stehen der wissenschaftlichen Gemeinschaft in Form einer quelloffenen Software zur Verfügung.

Unter Verwendung klinischer Proben wurde die neue Software mit Methoden konventioneller Diagnostik validiert und mit etablierten bioinformatischen Analyse-Pipelines verglichen. Sie detektiert Infektionserreger aus verschiedenen diagnostischen Entitäten zuverlässig und klassifiziert virale Erreger oft bis zur Ebene des Stammes. Darüber hinaus ist die Software in der Lage virale Genome vollständig zu rekonstruieren. Dies gelingt sogar in Proben, welche mit mehreren nah verwandten Stämmen infiziert sind.

Zusätzlich zu einer verbesserten Methode der taxonomische Klassifikation, bietet die neue Software auch Funktionen, welche in etablierten Analyse-Pipelines nicht vorhanden sind. Sie ist beispielsweise in der Lage, Proteindomänen zu annotieren und sie kann Sequenzen anhand dieser Annotationen klassifizieren. Als konservierte, funktionale Einheiten, können Proteindomänen zusätzliche Evidenz für das Vorhandensein möglicher Infektionserreger bieten. Sie können insbesondere dabei helfen, neuartige Infektionserreger zu identifizieren.

Neben der Auswertung einzelner Proben kann die Software auch kohortenbasierte Analysen durchführen. In diesem Modus werden probenübergreifende Vergleiche durchgeführt, um Sequenzsignaturen zu identifizieren welche in einer Gruppe von Proben im Vergleich zu einer Kontrollgruppe überrepräsentiert sind. Dieser Ansatz erfordert weder eine vorangegangene taxonomische Zuordnung, noch Homologie zu bereits beschriebenen Sequenzen. Er ermöglicht somit den Nachweis gänzlich neuartiger Infektionserreger.

Sequencing of diagnostic samples is widely considered a key technology that may fundamentally improve infectious disease diagnostics. The approach can not only identify pathogens already known to cause a specific disease, but may also detect pathogens that have not been previously attributed to this disease, as well as completely new, previously unknown pathogens. Therefore, it may significantly increase the level of preparedness for future outbreaks of emerging pathogens.

This study describes the development and application of methods for the identification of pathogenic agents in diagnostic samples. The methods have been successfully applied multiple times under clinical conditions. The corresponding results have been published within the scope of this thesis. Finally, the methods were made available to the scientific community as an open source bioinformatics tool.

The novel software was validated by conventional diagnostic methods and it was compared to established analysis pipelines using authentic clinical samples. It is able to identify pathogens from different diagnostic entities and often classifies viral agents down to strain level. Furthermore, the method is capable of assembling complete viral genomes, even from samples containing multiple closely related viral strains of the same viral family.

In addition to an improved method for taxonomic classification, the software offers functionality which is not present in established analysis pipelines. It is, for example, able to annotate protein domains and it performs the classification of sequences based on these annotations. The conserved, functional domains provide an additional level of evidence for the presence of putatively pathogenic agents and they may aid especially the detection of novel pathogens.

Asides from the analysis of individual samples, the software can perform cohort-based analyses. In this mode cross-sample comparisons are carried out to identify sequence signatures which are overrepresented in a group of samples in comparison to a control group. This approach neither requires previous taxonomic classification nor sequence homology searches in external databases and thus enables the detection of truly novel pathogenic agents.
URL: https://ediss.sub.uni-hamburg.de/handle/ediss/9040
URN: urn:nbn:de:gbv:18-ediss-93087
Dokumenttyp: Dissertation
Betreuer*in: Grundhoff, Adam
Kurtz, Stefan
Enthalten in den Sammlungen:Elektronische Dissertationen und Habilitationen

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat  
dissertation.pdf14.47 MBAdobe PDFÖffnen/Anzeigen
Zur Langanzeige

Info

Seitenansichten

36
Letzte Woche
Letzten Monat
geprüft am 01.08.2021

Download(s)

48
Letzte Woche
Letzten Monat
geprüft am 01.08.2021
Werkzeuge

Google ScholarTM

Prüfe