Volltextdatei(en) vorhanden
Titel: Computational methods for RNA 3D structure prediction and comparison
Sonstige Titel: Computermethoden für Vorhersagen und Vergleiche von 3D RNA-Strukturen
Sprache: Englisch
Autor*in: Petersen, Nils Peter
Schlagwörter: 3D Struktur; Strukturvorhersage; bioinformatics; RNA; simulation; coarse grain; structure comparison; structure alignment; structure prediction; optimizations; 3D structure
GND-Schlagwörter: Bioinformatik; Simulation; Kraftfeld; RNS; Struktur; Vergleich; Algorithmus; Software; Molekülstruktur
Erscheinungsdatum: 2020
Tag der mündlichen Prüfung: 2020-06-26
Zusammenfassung: 
This thesis presents several new methods and tools for the computational prediction and comparison of three-dimensional (3D) RNA structures.

The prediction of 3D macromolecular structures would reduce the effort invested in costly experiments. The established tool NAST uses molecular dynamics simulations and a knowledge-based force field to sample low resolution structure models of RNA molecules. In this work, a major flaw in the design of the force field is described, which causes numerical instabilities during the simulations. The way in which the respective energy terms are defined results in steep cliffs in the energy landscape for some combinations of bond and torsion angles. A new program NASTI (NAST Improved) is introduced as a numerically stable replacement for NAST. Several improvements were made to the formulation and parameterisation of the energy terms. The most important is a new smoothed energy term for the torsion angles which takes the neighboring bond angles into account removing the instabilities. Simulations were conducted to compare NASTI and NAST. NASTI runs steadily for millions of steps while NAST suffers routinely numerical catastrophes. Sampled structure models were assessed via comparison to crystal structures. For different test cases NASTI produces structures with equal or better quality compared to NAST.

Studies of evolution and function are often based on the comparison of large numbers of 3D structures. This requires fast methods. Several approaches to this problem were developed in this project. First, a new structural alphabet description of the RNA backbone is described. Structural alphabets are used to reduce the 3D shape of a macromolecule to a one-dimensional string of letters. The method presented here was developed specifically for RNA structure comparison. Unlike previous approaches, the procedure to find the mapping of backbone fragments to letters is formulated as an optimization task with the objective to find similar regions shared by distinct structures. The next developments presented here are two new tools for RNA 3D structure alignment. ALFONS uses the structural alphabet representation and CVRRY deploys novel geometric descriptors comprising inter-nucleotide distances and a chirality measure. Both tools are implemented into the same framework and share algorithms for alignment and superposition. A benchmark against three state of the art programs shows that the new tools are considerably faster while producing satisfactory alignments. Finally, the programs URSULA and FREEDOLIN were developed for applications where even faster comparisons are required. The tools use the new structural alphabet representation and enhanced suffix arrays for quick alignment-free comparison. An estimate of statistical significance of substring matches improves the accuracy. Database searches were conducted to demonstrate the ability of the two methods to find related structures. Both tools are very fast, while producing results of quality comparable to a previously published method.

Diese Arbeit beschreibt neue Methoden und Programme für automatische Vorhersagen und Vergleiche dreidimensionaler (3D) RNA-Strukturen.

Mit Hilfe zuverlässiger Vorhersagen makromolekularer 3D-Strukturen ließe sich viel Arbeit für aufwendige Experimente sparen. Das etablierte Programm NAST erzeugt RNA-Strukturmodelle mit niedriger Auflösung mittels Molekulardynamik-Simulation. In dieser Arbeit wird ein grundlegender und schwerwiegender Fehler im Aufbau des verwendeten Kraftfeldes beschrieben. Die Kombination von Termen für Bindungs- und Torsionswinkel führt zu extremen Steigungen in der Energiefunktion und dadurch zu numerisch instabilen Simulationen. Um dieses Problem zu beheben, wurde NASTI (NAST Improved) entwickelt. Form und Parameterisierung der Energieterme wurden durch unterschiedliche Veränderungen verbessert. Die wichtigste Erneuerung ist ein Energieterm für Torsionswinkel, der durch Hinzunahme der benachbarten Bindungswinkel die Simulationen stabilisiert. Während NASTI ohne numerische Probleme über Millionen Zeitschritte läuft, enden NAST-Simulationen regelmäßig in numerischen Katastrophen. Vergleicht man die vorhergesagten Modelle mit bekannten 3D-Strukturen, zeigt sich außerdem, dass NASTI gegenüber NAST gleichwertige oder bessere Ergebnisse erzielt.

3D-Strukturvergleiche sind zentrale Werkzeuge in Studien zur Evolution und Funktion von Makromolekülen. Im Rahmen der vorliegenden Arbeit wurden deshalb Methoden zum schnellen Vergleich von RNA-Strukturen entwickelt. Zunächst wird eine neue Methode, das RNA-Rückgrat durch ein Strukturalphabet zu beschreiben, vorgestellt. Strukturalphabete reduzieren 3D Molekülstrukturen auf eindimensionale Buchstabenfolgen. Die hier vorgestellte Methode ist speziell für den RNA-Strukturvergleich optimiert. Die Abbildung von Strukturfragmenten auf Alphabetsbuchtstaben wurde durch einen Suchalgorithmus mit dem Ziel, ähnliche Bereiche zwischen verschiedenen Strukturen zu finden, optimiert. Anschließend werden zwei neue Programme zur Berechnung von RNA-Strukturalignments vorgestellt. ALFONS verwendet das neue Strukturalphabet und CVRRY beruht auf der Verwendung geometrischer Deskriptoren für Rückgratfragmente. Die beiden Programme sind im Vergleich zu drei etablierten Methoden deutlich schneller und produzieren ähnlich gute Alignments. Für Anwendungen, die noch schnellere Strukturvergleiche erfordern, werden die Programme URSULA und FREEDOLIN vorgestellt. Indexstrukturen auf Sequenzen des neuen Strukturalphabets ermöglichen die Suche nach ähnlichen Strukturen in großen Datenbanken. Ein Signifikanzmaß für einander gleichende Teilsequenzen erhöht die Genauigkeit der Suchen. Im Vergleich zu einem bekannten Programm produzieren FREEDOLINund URSULA vergleichbare bis bessere Ergebnisse.
URL: https://ediss.sub.uni-hamburg.de/handle/ediss/8466
URN: urn:nbn:de:gbv:18-106054
Dokumenttyp: Dissertation
Betreuer*in: Torda, Andrew E. (Prof. Dr.)
Enthalten in den Sammlungen:Elektronische Dissertationen und Habilitationen

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat  
Dissertation.pdf12.98 MBAdobe PDFÖffnen/Anzeigen
Zur Langanzeige

Diese Publikation steht in elektronischer Form im Internet bereit und kann gelesen werden. Über den freien Zugang hinaus wurden durch die Urheberin / den Urheber keine weiteren Rechte eingeräumt. Nutzungshandlungen (wie zum Beispiel der Download, das Bearbeiten, das Weiterverbreiten) sind daher nur im Rahmen der gesetzlichen Erlaubnisse des Urheberrechtsgesetzes (UrhG) erlaubt. Dies gilt für die Publikation sowie für ihre einzelnen Bestandteile, soweit nichts Anderes ausgewiesen ist.

Info

Seitenansichten

109
Letzte Woche
Letzten Monat
geprüft am 16.04.2021

Download(s)

36
Letzte Woche
Letzten Monat
geprüft am 16.04.2021
Werkzeuge

Google ScholarTM

Prüfe