Optimal fitting of protein structures to electron microscopy maps

Karius, Kai

Titel:	Optimal fitting of protein structures to electron microscopy maps
Sonstige Titel:	Optimales Fitting von Proteinstrukturen in Elektronenmikroskopie-Dichteverteilungen
Sprache:	Englisch
Autor*in:	Karius, Kai
Schlagwörter:	Numerische Quadratur; Systematisches Fitting; Proteinkomplexe; Entropie; Orthogonale Polynome
GND-Schlagwörter:	BiologieGND MultiproteinkomplexGND KristallographieGND ElektronenmikroskopieGND Monte-Carlo-SimulationGND
Erscheinungsdatum:	2021
Tag der mündlichen Prüfung:	2022-09-26
Zusammenfassung:	In dieser Dissertation wird die Rolle des systematischen Fittings im Kontext des integrativen strukturellen Modelings betrachtet. Diese Art des Modelings dient dazu, Modelle von makromolekularen Komplexen aus verschiedenen Datenquellen zu generieren und ist zum Beispiel in Form der Softwarepipeline Assembline implementiert. Die Datentypen, welche integriert werden, umfassen neben Eektronendichtekarten, welche aus der Kryoelektronenmikroskopie und der Kryoelektronentomographie gewonnen wurden, auch Kristallstrukturen von Komplexen, Proteinen, RNA-Strukturen und Protein-Untereinheiten sowie Crosslinks und biochemische Informationen. Das systematische Fitting ist der erste Schritt in der Assembline Softwarepipeline und stellt ein Ensemble möglicher Positionen und Orientierungen der Strukturen, aus welche sich der makromolekulare Komplex zusammensetz, zur Verfügung. Aus diesen möglichen Positionen und Orientierungen wird in der weiteren Pipeline eine Anzahl von wahrscheinlichen Modellen generiert. Das systematische Fitting kann, im Rahmen der Assembline pipeline, als einer der informationsreichsten Quellen angesehen werden. Es gibt eine Anzahl von Möglichkeiten, wie man das systematische Fitting durchführen kann. Von Fall zu Fall können die Ergebnisse sehr unterschiedlich ausfallen. Diese Arbeit untersucht die Frage, wie ein Maximum an Information aus den gegebenen Daten gewonnen werden kann und welche computerwissenschaftlichen, numerischen und mathematischen Konzepte genutzt werden können, um das Modellieren von biomolekularen Komplexen zu optimieren. Verschiedene Modellingprojekte wurden in verschienden Kapazit aten begleitet. Die Strukturbestimmung des TFIIIC-Komplexes (Transkriptionsfaktoruntereinheit C des Pr ainitiationskomplexes der Polymerase III in Eukaryoten) wurde sowohl durch systematisches Fitting als auch strukturelles integratives Modelling unterstützt. Obwohl die Gesamtstruktur des TFIIIC nicht bestimmt werden konnte, konnte die Struktur des Subkomplexes A ermittelt werden. Für die zum Subcomplex B gehörigen Domäne Brf1-TBP und A konnten schliesslich wahrscheinliche Positionen und Orientierungen in einer negative stain Elektronendichtekarte von TFIIIC bestimmt werden ([83]). In einem weiterem Modellingprojekt ist es gelungen einen Subkomplex, den sogenannte P-Komplex, in einem in-situ Tomogram einer Speiche der Kernpore in s. cerevisia wahrscheinliche Positionen und Orientierungen durch systematisches Fitting zuzuordnen. Hier wurde programmatische Werkzeuge zur einfacheren Auswertung der statistischen Analyse des systematischen Fittings implementiert und eine Analyse und Rechtfertigung der verschiedenen Scoring-Optionen im systematischen Fitting zur Verfügung gestellt ([85]). Die Assembline Software pipeline wurde erstmals der Öffentlichkeit zugänglich gemacht, zusammen mit ausführlichen Beispielen und Anleitungen, um die Benutzung zu vereinfachen. Hier wurden ein neues Konvergenzkriterium implementiert, welches unnötige lange Monte-Carlo-L aufe verhindert([26]). Desweiteren wurden die grundlegenden Datentypen und einige der Algorithmen, welche im systematischen Fitting essentiell sind, auf modernen GPU(Graphical Processing Unit)-Systemen implementiert und getestet. Hierbei wurde darauf geachtet, die spezifischen Eigenheiten der GPU-Architektur zu gut wie möglich auszunutzen und die Nutzung mehrer GPUs in großen Clustern zu ermöglichen. Methoden der numerischen Mathematik wurden genutzt, um dem systematischen Fitting verfeinerbare, 6-dimensionale Suchgitter zur Verfügung zu stellen. Diese ermöglichen zudem das berechnen 6-dimensionaler Statistiken, welche das gewählte Fittingprotokoll als Gesamtes charakterisiert. Desweiteren wurde die partial-surface-score als Scoring Methode eingeführt, welche insbesondere unvollständige Oberachensegmente fitten kann. Ein erschöpfender adaptiver paralleler Suchalgorithmus für 6-dimensionale Räume wurde beschrieben, implementiert und getestet im Fall von TFIIIC. Das erwartete lokale Minimum wurde erfolgreich gefunden in einer Zeit von ca 1:8 s. Methoden der Informationstheorie wurden benutzt, um das Ergebnis eines systematischen Fittingprotokolls (im obigen Sinne) auf seinen Informationsgehalt zu uberprüfen. Somit wurde ein Kriterium erschaffen,mit dem sich informationsreichere von informations armeren Fittingprotokollen unterscheiden lassen. Dies wurde an zwei konkreten Probleme getestet: Der Unterscheidung des Informationsgehaltes zweier verschiedener Scoringmethoden und der Optimierung des Informationsgehaltes einer Scoringmethode mit Hinsicht auf einen Parameter.
URL:	https://ediss.sub.uni-hamburg.de/handle/ediss/9868
URN:	urn:nbn:de:gbv:18-ediss-103848
Dokumenttyp:	Dissertation
Betreuer*in:	Gilberger, Tim
Enthalten in den Sammlungen:	Elektronische Dissertationen und Habilitationen

Dateien zu dieser Ressource:

Datei	Beschreibung	Prüfsumme	Größe	Format
Dissertation.pdf		9803ab6957e159857ccc6b4e29bea3ff	7.49 MB	Adobe PDF	Öffnen/Anzeigen

Zur Langanzeige

Info

Seitenansichten

276

Letzte Woche

Letzten Monat

geprüft am 23.02.2026

Download(s)

359

Letzte Woche

Letzten Monat

geprüft am 23.02.2026

Werkzeuge

Google Scholar^TM

Prüfe

Dateien zu dieser Ressource:

Seitenansichten

Download(s)

Google ScholarTM

Google Scholar^TM