FAQ
© 2017 Staats- und Universitätsbibliothek
Hamburg, Carl von Ossietzky

Öffnungszeiten heute09.00 bis 24.00 Uhr alle Öffnungszeiten

Eingang zum Volltext in OPUS

Hinweis zum Urheberrecht

Dissertation zugänglich unter
URN: urn:nbn:de:gbv:18-82724
URL: http://ediss.sub.uni-hamburg.de/volltexte/2017/8272/


Structural Bioinformatics and Crystallography Tools for Automated Protein Model Building and Validation

Strukturelle Bioinformatik und Kristallographieverfahren für automatisierten Protein Modellbau und Validierung

Pereira, Joana

pdf-Format:
 Dokument 1.pdf (32.314 KB) 


Basisklassifikation: 35.62
Institut: Chemie
DDC-Sachgruppe: Chemie
Dokumentart: Dissertation
Hauptberichter: Torda, Andrew E. (Prof. Dr.)
Sprache: Englisch
Tag der mündlichen Prüfung: 09.12.2016
Erstellungsjahr: 2016
Publikationsdatum: 19.01.2017
Kurzfassung auf Englisch: Deciphering the structures of biological macromolecules is essential to understand their function in cellular processes and their role in human diseases. Macromolecular X-ray crystallography is the most successful and widely used technique for such studies. However, large macromolecules and their assemblies usually do not provide crystallographic data at an atomic level of detail and the resulting electron density maps are insufficiently informative. This makes their automatic interpretation more difficult and less accurate. While methods for the extension of fragmented protein models have been developed in the past, more complete models are not necessarily more correct. It is therefore imperative to validate crystallographic models not only before depositing them to a databank but also during the model-building procedure.
In this thesis, this issue is addressed at two levels. The main one concerns the development of a validation tool that is not only useful at the later stages of the crystallographic experiment but also during protein model building. The most commonly used methods for the validation of protein backbone conformation are based on the two-dimensional distribution of its dihedral angles. Based on the premise that molecular conformation can be defined by the relative position of atoms in the three-dimensional space and by the chirality of asymmetric atomic groups, a three- dimensional space, DipSpace, was developed which allows the description of protein stereochemistry and highlights residues in an unusual conformation that may not be detectable with other approaches. It was implemented within a tool, DipCheck, which can be used for the general validation of protein models but is also used by ARP/wARP during automated protein model building. DipCheck evaluates any protein model, pointing to problematic residues and providing an overall score of protein backbone quality. Following a modification of the ARP/wARP protein model building protocol, the quality of protein models built at a resolution between 2.5 and 3.0 Å by ARP/wARP is now improved.
The second level concerns the study and the implementation of changes to the ARP/wARP protocol for protein automated model building at medium-to-low resolution, including the geometrisation of identified dipeptide units and the application of density shape descriptors for the identification of side-chains, but also the improvement in the automated building of bound ligands. In this last case, the inclusion of an energetic term during the ranking of possible ligands for a given binding site proved helpful for the validation of already deposited protein-ligand complexes and also for the correct identification of the ligand in a given density cluster.
Kurzfassung auf Deutsch: Die Kenntnis der Strukturen biologischer Makromoleküle ist von zentraler Bedeutung für das Verständnis ihrer Funktion in zellulären Prozessen und ihrer Rolle bei Erkrankungen des Menschen. Makromolekulare Röntgenkristallographie ist die erfolgreichste und am weitesten verbreitete Technik für solche Studien. Allerdings können insbesondere bei großen Makromolekülen und deren Komplexen oft keine hinreichend hoch aufgelösten kristallographischen Daten gemessen werden, und die daraus resultierenden Elektronendichtekarten sind nicht ausreichend informativ. Dies macht ihre automatische Interpretation schwieriger und weniger präzise. Während die in der Vergangenheit entwickelten Verfahren zur Erweiterung von fragmentierten Proteinmodellen zwar vermeintlich vollständigere Modelle ergeben, sind diese nicht notwendigerweise richtiger. Es ist daher zwingend notwendig, kristallographische Modelle nicht nur dann zu validieren, wenn diese in Datenbanken veröffentlicht werden, sondern bereits während das Model in die Elektronendichtekarten gebaut wird.
Die vorliegende Arbeit befasst sich mit diesem Problem auf zwei Ebenen. Die erste und wichtigere Ebene betrifft die Entwicklung eines Validierungswerkzeuges, das sowohl in den späteren Phasen des kristallographischen Experimentes, als auch während der Proteinmodellierung nützlich ist. Die am häufigsten verwendete Methode zur Validierung der Konformation des Protein-Rückgrats basiert auf der zweidimensionalen Verteilung der Torsionswinkel. Unter der Annahme, dass die molekulare Konformation durch die relative Position der Atome im dreidimensionalen Raum und die Chiralität von asymmetrischen Atomgruppen definiert ist, wurde DipSpace entwickelt. DipSpace ist ein dreidimensionaler Raum, der die Beschreibung der Protein-Stereochemie ermöglicht, wobei Aminosäuren in ungewöhnlicher Konformation auffallen, welche mit anderen Methoden nicht erkannt werden können. Das DipSpace-Konzept wurde als Software-Werkzeug implementiert – genannt DipCheck - welches für die allgemeine Validierung von Proteinmodellen verwendet werden kann, aber auch von ARP/wARP während der automatisierten Proteinmodellierung aufgerufen wird. Durch die entsprechende Anpassung von ARP/wARP, konnte die Qualität von Proteinmodellen mit einer Auflösung zwischen 2,5 und 3,0 Å deutlich verbessert werden.
Die zweite Ebene betrifft die Analyse und die Umsetzung von Änderungen an verschiedenen ARP/wARP Protokollen zum automatisierten Modellbau für Proteine bei mittlerer bis niedriger Auflösung. Dies schließt die Geometrisierung der identifizierten Dipeptideinheiten, die Anwendung von Deskriptoren für die dreidimensionale Form der Dichteverteilung zur Identifizierung von Seitenketten, sowie die Verbesserung der automatisierten Modellierung von gebundenen Liganden ein.
Für den letzten Fall wurde die Bindungsenergie zwischen Protein und Ligand für die Bewertung von möglichen Liganden für eine bestimmte Bindungsstelle als zusätzlicher Term eingeführt, was sich als hilfreich für die Validierung bereits bekannter Protein-Ligand-Komplexe erwiesen hat aber auch die korrekte Identifizierung eines Liganden in einem Dichte-Cluster unterstützt.

Zugriffsstatistik

keine Statistikdaten vorhanden
Legende