Titel: Optimal fitting of protein structures to electron microscopy maps
Sonstige Titel: Optimales Fitting von Proteinstrukturen in Elektronenmikroskopie-Dichteverteilungen
Sprache: Englisch
Autor*in: Karius, Kai
Schlagwörter: Numerische Quadratur; Systematisches Fitting; Proteinkomplexe; Entropie; Orthogonale Polynome
GND-Schlagwörter: BiologieGND
MultiproteinkomplexGND
KristallographieGND
ElektronenmikroskopieGND
Monte-Carlo-SimulationGND
Erscheinungsdatum: 2021
Tag der mündlichen Prüfung: 2022-09-26
Zusammenfassung: 
In dieser Dissertation wird die Rolle des systematischen Fittings im Kontext des integrativen strukturellen Modelings betrachtet. Diese Art des Modelings dient dazu, Modelle von makromolekularen Komplexen aus verschiedenen Datenquellen zu generieren und ist zum Beispiel in Form der Softwarepipeline Assembline implementiert. Die Datentypen, welche integriert werden, umfassen neben Eektronendichtekarten, welche aus der Kryoelektronenmikroskopie und der Kryoelektronentomographie gewonnen wurden, auch Kristallstrukturen von Komplexen, Proteinen, RNA-Strukturen und Protein-Untereinheiten sowie Crosslinks und biochemische Informationen. Das systematische Fitting ist der erste Schritt in der Assembline Softwarepipeline und stellt ein Ensemble möglicher Positionen und Orientierungen der Strukturen, aus welche sich der makromolekulare Komplex zusammensetz, zur Verfügung. Aus diesen möglichen Positionen und Orientierungen wird in der weiteren Pipeline eine Anzahl von wahrscheinlichen Modellen generiert. Das systematische Fitting kann, im Rahmen der Assembline pipeline, als einer der informationsreichsten Quellen angesehen werden. Es gibt eine Anzahl von Möglichkeiten, wie man das systematische Fitting durchführen kann. Von Fall zu Fall können die Ergebnisse sehr unterschiedlich ausfallen. Diese Arbeit untersucht die Frage, wie ein Maximum an Information aus den gegebenen Daten gewonnen werden kann und welche computerwissenschaftlichen, numerischen und mathematischen Konzepte genutzt werden können, um das Modellieren von biomolekularen Komplexen zu optimieren. Verschiedene Modellingprojekte wurden in verschienden Kapazit aten begleitet. Die Strukturbestimmung des TFIIIC-Komplexes (Transkriptionsfaktoruntereinheit C des Pr ainitiationskomplexes der Polymerase III in Eukaryoten) wurde sowohl durch systematisches Fitting als auch strukturelles integratives Modelling unterstützt. Obwohl die Gesamtstruktur des TFIIIC nicht bestimmt werden konnte, konnte die Struktur des Subkomplexes A ermittelt werden. Für die zum Subcomplex B gehörigen Domäne Brf1-TBP und A konnten schliesslich wahrscheinliche Positionen und Orientierungen in einer negative stain Elektronendichtekarte von TFIIIC bestimmt werden ([83]). In einem weiterem Modellingprojekt ist es gelungen einen Subkomplex, den sogenannte P-Komplex, in einem in-situ Tomogram einer Speiche der Kernpore in s. cerevisia wahrscheinliche Positionen und Orientierungen durch systematisches Fitting zuzuordnen. Hier wurde programmatische Werkzeuge zur einfacheren Auswertung der statistischen Analyse des systematischen Fittings implementiert und eine Analyse und Rechtfertigung der verschiedenen Scoring-Optionen im systematischen Fitting zur Verfügung gestellt ([85]). Die Assembline Software pipeline wurde erstmals der Öffentlichkeit zugänglich gemacht, zusammen mit ausführlichen Beispielen und Anleitungen, um die Benutzung zu vereinfachen. Hier wurden ein neues Konvergenzkriterium implementiert, welches unnötige lange Monte-Carlo-L aufe verhindert([26]). Desweiteren wurden die grundlegenden Datentypen und einige der Algorithmen, welche im systematischen Fitting essentiell sind, auf modernen GPU(Graphical Processing Unit)-Systemen implementiert und getestet. Hierbei wurde darauf geachtet, die spezifischen Eigenheiten der GPU-Architektur zu gut wie möglich auszunutzen und die Nutzung mehrer GPUs in großen Clustern zu ermöglichen. Methoden der numerischen Mathematik wurden genutzt, um dem systematischen Fitting verfeinerbare, 6-dimensionale Suchgitter zur Verfügung zu stellen. Diese ermöglichen zudem das berechnen 6-dimensionaler Statistiken, welche das gewählte Fittingprotokoll als Gesamtes charakterisiert. Desweiteren wurde die partial-surface-score als Scoring Methode eingeführt, welche insbesondere unvollständige Oberachensegmente fitten kann. Ein erschöpfender adaptiver paralleler Suchalgorithmus für 6-dimensionale Räume wurde beschrieben, implementiert und getestet im Fall von TFIIIC. Das erwartete lokale Minimum wurde erfolgreich gefunden in einer Zeit von ca 1:8 s. Methoden der Informationstheorie wurden benutzt, um das Ergebnis eines systematischen Fittingprotokolls (im obigen Sinne) auf seinen Informationsgehalt zu uberprüfen. Somit wurde ein Kriterium erschaffen,mit dem sich informationsreichere von informations armeren Fittingprotokollen unterscheiden lassen. Dies wurde an zwei konkreten Probleme getestet: Der Unterscheidung des Informationsgehaltes zweier verschiedener Scoringmethoden und der Optimierung des Informationsgehaltes einer Scoringmethode mit Hinsicht auf einen Parameter.
URL: https://ediss.sub.uni-hamburg.de/handle/ediss/9868
URN: urn:nbn:de:gbv:18-ediss-103848
Dokumenttyp: Dissertation
Betreuer*in: Gilberger, Tim
Enthalten in den Sammlungen:Elektronische Dissertationen und Habilitationen

Dateien zu dieser Ressource:
Datei Beschreibung Prüfsumme GrößeFormat  
Dissertation.pdf9803ab6957e159857ccc6b4e29bea3ff7.49 MBAdobe PDFÖffnen/Anzeigen
Zur Langanzeige

Info

Seitenansichten

37
Letzte Woche
Letzten Monat
geprüft am 06.12.2022

Download(s)

6
Letzte Woche
Letzten Monat
geprüft am 06.12.2022
Werkzeuge

Google ScholarTM

Prüfe