Titel: Methoden zur geometrischen Suche in Proteinstruktursammlungen
Sonstige Titel: Methods for Geometric Mining in Protein Structure Collections
Sprache: mehrsprachig
Autor*in: Graef, Joel
Schlagwörter: Bindetaschen; Protein-Ligand-Interaktion; Protein-Protein-Interaktion; Geometrische Mustersuche; Chemieinformatik
GND-Schlagwörter: ArzneimitteldesignGND
DatenbankGND
Computational chemistryGND
AlgorithmusGND
LigandGND
ProteineGND
Erscheinungsdatum: 2024-03
Tag der mündlichen Prüfung: 2024-06-04
Zusammenfassung: 
Für die Funktion und Stabilität von Proteinen und Proteinkomplexen ist die intermolekulare Wechselwirkung zentraler Bestandteil. Durch sie werden biologische Prozesse in Gang gesetzt, reguliert oder gestoppt. Die Bestimmung und Erforschung dieser Wechselwirkungen in Bindestellen bildet deshalb ein Kernelement des computergestützten Wirkstoffentwurfs. Grundlage hierfür sind Protein-Ligand- und Protein-Protein-Komplexe, die in Datenbanken wie der öffentlich zugänglichen Protein Data Bank (PDB) vorliegen. Zur Analyse und systematischen Durchsuchung der stetig zunehmenden Anzahl verfügbarer Strukturen bedarf es effizienter Programme. Insbesondere die Suche nach ähnlichen Bindestellen ermöglicht die Vorhersage von Proteinfunktionen oder Interaktionspartnern. Dies basiert auf der Suche nach geometrischen Anordnungen von Atomen. Hierfür ist eine präzise Repräsentation der strukturellen und chemischen Eigenschaften vonnöten. Verfügbare Software zur systematischen Durchsuchung von Bindestellen deckt jedoch zumeist nur ein kleines Set von Eigenschaften ab und eignet sich nur eingeschränkt zur Analyse großer Datenmengen.

Zur Durchführung nutzerspezifischer Suchanfragen bei hoher Flexibilität und umfangreicher Datenabdeckung in Bindestellen wurden im Rahmen dieses Promotionsprojekts drei Verfahren entwickelt. Zunächst wurde eine Methode zur Detektion von Bindestellen kleiner Moleküle für die Anwendung auf große Strukturkollektionen optimiert und reimplementiert. Die Identifizierung von vergrabenen Stellen auf der Proteinoberfläche basiert auf der Diskretisierung des Proteins mithilfe eines Gitters und stellt eine der präzisesten geometrischen Bindetaschenvorhersagemethoden dar. Das zweite Verfahren generiert eine Datenbank der Geometrie und Eigenschaften dieser Bindestellen, die durch textuelle, numerische und geometrische Anfragen durchsucht werden kann. Die Angabe von textuellen und numerischen Eigenschaften wie des PDB-Codes oder der Bindestellentiefe ermöglicht die Reduzierung des Suchraums. Mithilfe geometrischer Anfragen können innerhalb kürzester Zeit ähnliche atomare Anordnungen gefunden werden. Anhand zahlreicher Beispiele zur Analyse von medizinisch relevanten Proteinkinasen konnte die Anwendbarkeit der Methode überzeugend demonstriert werden. Die Effizienz dieser Methodologie wird in der dritten Methode genutzt, um die Ähnlichkeit von Protein-Protein-Bindestellen zu bestimmen. Mithilfe automatisch generierter Suchanfragen können so verwandte Bindestellen erfolgreich erkannt und auf Grundlage der identifizierten ähnlichen Eigenschaften überlagert werden, wie ein Vergleich mit gängigen Methoden zeigt. Die im Rahmen dieser Arbeit entwickelten Software-Applikationen ermöglichen umfassende Analysen, die von der Vorhersage möglicher Bindungstaschen über die Analyse von Protein-Ligand-Interaktionen bis hin zur Ähnlichkeitssuche von Protein-Protein-Komplexen reichen.

Intermolecular interactions are key to the function and stability of proteins and protein complexes. Biological processes are initiated, regulated, or stopped by molecular interactions. The determination and investigation of these interactions in binding sites thus forms a fundamental element of computer-aided drug design. It is based on structures of protein-ligand and protein-protein complexes, which are available in databases such as the publicly accessible Protein Data Bank (PDB). Efficient programs are needed to analyze and screen the ever-increasing number of available structures. In particular, the search for similar binding sites enables the prediction of protein functions or interaction partners. For this purpose, geometric arrangements of atoms are searched for. This search requires a precise representation of the structural and chemical properties. However, available software for the screening of binding sites usually only covers a small set of properties and is only of limited suitability for analyzing large amounts of data.

To perform user-specific and individualized searches and extensive data coverage in binding sites, three methods were developed in the context of this thesis. First, a method for detecting binding sites of small molecules was optimized and reimplemented for the application to large structure collections. The identification of buried sites on the protein surface is based on the discretization of the protein using a grid. This method was shown to be one of the most accurate geometric binding pocket prediction methods. The second method generates a database of the geometry and properties of these detected binding sites, which can be searched by textual, numerical, and geometrical queries. The specification of textual and numerical properties such as the PDB code or the binding site depth enables the reduction of the search space. Using geometric queries, similar atomic arrangements can be found within reasonable time. The applicability of the method could be convincingly demonstrated by numerous examples for the analysis of pharmaceutically relevant protein kinases. The efficiency of this methodology is exploited in the third method to determine the similarity of protein-protein binding sites. With the help of automatically generated search queries, related binding sites can thereby be successfully detected and superimposed based on the detected similarities, as shown by comparing it with commonly used methods. The software applications developed as part of this work enable comprehensive analyses ranging from the prediction of possible binding pockets to the analysis of protein-ligand interactions and similarity searches in databases of protein-protein complexes.
URL: https://ediss.sub.uni-hamburg.de/handle/ediss/10954
URN: urn:nbn:de:gbv:18-ediss-118402
Dokumenttyp: Dissertation
Betreuer*in: Rarey, Matthias
Enthalten in den Sammlungen:Elektronische Dissertationen und Habilitationen

Dateien zu dieser Ressource:
Datei Prüfsumme GrößeFormat  
Dissertation.pdfdded57fd6d961132a979a06464002a0440.91 MBAdobe PDFÖffnen/Anzeigen
Zur Langanzeige

Info

Seitenansichten

Letzte Woche
Letzten Monat
geprüft am null

Download(s)

Letzte Woche
Letzten Monat
geprüft am null
Werkzeuge

Google ScholarTM

Prüfe