FAQ
© 2018 Staats- und Universitätsbibliothek
Hamburg, Carl von Ossietzky

Öffnungszeiten heute10.00 bis 24.00 Uhr alle Öffnungszeiten

Eingang zum Volltext in OPUS

Hinweis zum Urheberrecht

Dissertation zugänglich unter
URN: urn:nbn:de:gbv:18-88905
URL: http://ediss.sub.uni-hamburg.de/volltexte/2018/8890/


Mining of Interaction Geometries in Collections of Protein Structures

Suche nach Interaktionsgeometrien in Sammlungen von Proteinstrukturen

Inhester, Therese

pdf-Format:
 Dokument 1.pdf (17.219 KB) 


SWD-Schlagwörter: Proteine , Ligand , Arzneimitteldesign , Interaktion , Computational chemistry , Datenbank
Freie Schlagwörter (Deutsch): Protein-Ligand Interaktionen , Data Mining , Proteinstrukturen
Freie Schlagwörter (Englisch): Protein-Ligand Interactions , Cheminformatics , Data Mining , Protein Structures
Basisklassifikation: 54.80 , 54.64 , 35.06
Institut: Informatik
DDC-Sachgruppe: Informatik
Dokumentart: Dissertation
Hauptberichter: Rarey, Matthias (Prof. Dr.)
Sprache: Englisch
Tag der mündlichen Prüfung: 10.11.2017
Erstellungsjahr: 2017
Publikationsdatum: 15.01.2018
Kurzfassung auf Deutsch: Die vorliegende Arbeit beschreibt die Entwicklung von neuen Methoden zur Suche nach Interaktionsgeometrien in Proteinstruktursammlungen. Die Bindung zwischen einem Protein und einem kleinen Molekül oder zwischen zwei Proteinen ist ein fundamentaler Prozess in lebenden Zellen. Ein vollständiges Verständnis darüber warum zwei Moleküle binden und dessen Manipulation ist ein wichtiger Aspekt im Bereich des strukturbasierten Wirkstoffentwurfs. Die Basis von molekularer Bindung sind nicht kovalente Interaktionen zwischen Atomen. Methoden, die in der Lage sind die wachsende Menge an Daten nach geometrischen Präferenzen dieser Interaktion zu durchsuchen können helfen die treibenden Kräfte hinter diesen Bindungen besser zu verstehen. Existierende Methoden in diesem Feld bieten jedoch nicht genung Flexibilität und Präzision bezogen auf die möglichen Suchanfragen und in die analysierten Daten.
In dieser Arbeit wurden zwei Methoden entwickelt die das beschriebene Problem von verschiedenen Standpunkten betrachten. Die erste Methode (Pelikan) ermöglicht die Suche nach spezifischen Interaktionsmustern an der Schnittstelle zwischen Protein und Ligand. Damit können sogenannte Bioisostere und Chemoisistere entdeckt werden, die insbesondere dann von Nutzen sind, wenn spezifische Substrukturen in Liganden ausgetauscht oder mögliche Nebenenffekte eines Liganden vorhergesagt werden sollen. Die zweite Methode (NAOMI nova) berechnet geometrische Verteilungen von
interagierenden Atomen im Umfeld von molekularen Substrukturen aus Proteinstruktursammlungen.
Aus diesen Verteilungen können bevorzugte Interaktionsrichtungen abgeleitet werden, die beim Optimieren von Liganden und der Affinitätsvorhersage von Nutzen sind.
Beide Methoden benutzten eine server-lose Datenbank um die benötigten Daten effizient zu speichern. Hierfür wurden schnelle und flexible Suchverfahren entwickelt, die über existierende Methoden hinausgehen. Im Fall von Pelikan werden flexible und präzise 3D Anfragen auf atomarem Level unterstützt. Die Methode in NAOMI nova arbeitet mit benutzerspezifizierten molekularen Substrukturen und unterstützt verschiedene Attribute von Substrukturen und interagierenden Atomen in den Anfragen. Zusätzlich können die für die Suche genuzten Daten angepasst werden. Die Korrektheit, das Leistungsspektrum und die Anwendbarkeit beider Methoden werden in dieser Arbeit demonstriert. Darüber hinaus wurden grafische Oberflächen entwickelt, welche eine intuituve Benutzung durch Forscher aus dem Bereich der Lebenswissenschaften ermöglicht.
Kurzfassung auf Englisch: The thesis at hand presents the development of new methods for the mining of interaction geometries in collections of protein structures. The binding between a protein and a small molecule or between two proteins is a fundamental event in all processes in living cells. Its complete understanding and manipulation is key in the field of structure-based drug design. The basis of molecular recognition are non-covalent interactions between atoms. Tools which can be used to mine the ever-growing data for specific spatial preferences of these interactions can help understanding the nature of molecular recognition. However, existing tools suffer from low variability and low precision of the used data and of the possible queries.
In this thesis, two methods have been developed which tackle the problem from two different perspectives. The first method, Pelikan, allows a user to search for specific interaction patterns in the interface between proteins and ligands. Using this methodology, bioisosters and chemoisosters can be found. This is particular useful if specific substructures in a ligand are to be replaced or a potential side-effect of a ligand is to be determined. The second method, NAOMI nova, calculates and presents distributions of interacting atoms in the vicinity of molecular substructures in collections of protein structures. From these distributions, preferred interaction directions can be deduced which is of major importance in the process of ligand optimization and affinity prediction during a drug design project.
For both methods, a serverless database system is used to efficiently store the relevant data. Fast and flexible retrieval systems have been developed for these database systems which go beyond existing methods. The retrieval system of Pelikan supports flexible as well as precise 3D queries on an atomic level. The NAOMI nova method handles user-defined molecular substructures and supports queries using different attributes of substructures and interacting atoms. In addition, the data used for the search processes is highly flexible and can be easily adapted. The correctness and the performance of the retrieval systems are demonstrated in this work and their applicability is shown in different examples. In addition, graphical user interfaces have been developed as part of this work which allow immediate and intuitive usage of the methods by life-science researchers.

Zugriffsstatistik

keine Statistikdaten vorhanden
Legende