FAQ
© 2015 Staats- und Universitätsbibliothek
Hamburg, Carl von Ossietzky

Öffnungszeiten heute09.00 bis 24.00 Uhr alle Öffnungszeiten

Eingang zum Volltext in OPUS

Hinweis zum Urheberrecht

Dissertation zugänglich unter
URN: urn:nbn:de:gbv:18-69776
URL: http://ediss.sub.uni-hamburg.de/volltexte/2014/6977/


Protein-Ligand Inverse Screening and its Application in Biotechnology and Pharmacology

Inverses Protein-Ligand Screening und dessen Anwendung in Pharmakologie und Biotechnologie

Schomburg, Karen

pdf-Format:
 Dokument 1.pdf (36.150 KB) 


SWD-Schlagwörter: Computational chemistry , Screening , Arzneimitteldesign , Biotechnologie , Datensatz , Proteine , Ligand
Freie Schlagwörter (Deutsch): Targetvorhersage , Targetvalidierung , inverses Screening , inverses Docking
Freie Schlagwörter (Englisch): Target prediction , target validation , inverse screening , inverse docking
Basisklassifikation: 35.06 , 54.64 , 54.80 , 58.30
Institut: Informatik
DDC-Sachgruppe: Informatik
Dokumentart: Dissertation
Hauptberichter: Rarey, Matthias (Prof. Dr.)
Sprache: Deutsch
Tag der mündlichen Prüfung: 14.07.2014
Erstellungsjahr: 2014
Publikationsdatum: 19.09.2014
Kurzfassung auf Englisch: The thesis at hand presents the development of a new computational target prediction
method. Small molecules are rarely only binding to a single protein, but can interact with
numerous proteins, their targets. Ignorance of molecule-protein interactions can lead to various
problems, wherein the most dangerous probably are side-effects evoked by drugs binding
to so-far unknown off-targets. Resolving these problems is the aim of target prediction
methods, which try to find all target proteins for small molecules.
The iRAISE method developed in this thesis faces the special requirements of structure-based
inverse screening which in comparison to normal screening (one protein, many ligands) predicts
targets for one small molecule from large protein libraries.
In order to account for the large amounts of protein structural data, iRAISE introduces a
database representation for efficient and consistent handling and storing of protein data.
Further, protein active sites and small molecules are in the first screening step abstracted by
a descriptor representation. The chosen descriptor contains features encoding the interaction
pattern and the shape of the active site/molecule. Thus, by matching complementary
descriptors, the need for sequential protein-ligand matching on atomic level is avoided.
Inter-target ranking has been improved compared to standard protein-ligand scoring functions,
which mostly contain a bias towards certain protein structures. A multi-step Scoring
Cascade considers the reference ligand as well as the coverage of the ligand and pocket, and
thus allows the scoring of structurally diverse pockets. Moreover, a Gaussian-based scoring
assesses the significance of a score.
Along with the new target prediction method, an evaluation strategy with new data sets
has been developed. The evaluation of binding mode prediction, target ranking and running
time shows promising results for iRAISE.
Further, structure-based computational methods were successfully applied in a biotechnological
case study of the development of a synthetic multi-enzyme pathway, highlighting
the application potentials of these methods in areas besides drug design where their use is
already established.
Kurzfassung auf Deutsch: Die vorliegende Arbeit präsentiert die Entwicklung einer neuen, computergestützen Methode
zur Zielproteinvorhersage. Kleine organische Moleküle binden nur selten an ein einziges Protein,
sondern interagieren mit einer Reihe von verschiedenen Proteinen, sogenannten Zielproteinen
oder Targets. Dies kann zu verschiedenen Problemen führen, wobei vermutlich die verheerendsten
die Nebenwirkungen von Medikamenten sind, welche durch Bindung von Wirkstoffen
an Off-Targets entstehen. Aus diesem Grund versuchen Target-Vorhersagemethoden
alle Zielproteine für kleine Moleküle zu identifizieren.
Die in dieser Arbeit entwickelte Methode iRAISE behandelt die speziellen Anforderungen
an strukturbasiertes inverses Screening, bei welchem im Gegensatz zum normalen virtuellen
Screening (ein Protein, viele Moleküle) potentielle Targets für ein Molekül in großen Mengen
von Proteinen gesucht werden.
Die großen Datenmengen von zehntausenden von Proteinstrukturen werden in iRAISE in
einer neu entwickelten Datenbank effizient und konsistent gespeichert. Außerdem werden
sowohl Protein- als auch Ligandstrukturen im ersten Screening-Schritt durch einen Deskriptor
abstrahiert. Der gewählte Deskriptor repräsentiert sowohl das Interaktionsmuster als
auch die Form von Protein und Ligand. Indem die Deskriptoren auf Komplementarität
getestet werden, erübrigt es sich, jeden Ligand sequenziell gegen jedes Protein auf atomarer
Basis zu testen. Des Weiteren wurde das Ranking von Targets durch innovative Maßnahmen
verbessert, um einen Bias bezüglich bestimmter Proteinstrukturen zu beheben, der häufig bei
Bewertungsfunktionen für ’normales’ Protein-Ligand Docking besteht. Die sogenannte Scoring
Cascade besteht aus mehreren Bewertungsstufen, welche neben der Berücksichtigung des
Referenzliganden die Abdeckung des Liganden und des aktiven Zentrums betrachtet. Dies
ermöglicht die Bewertung von strukturell diverser Taschen ohne Bias. Zusätzlich wurde eine
Gauß-basierte Bewertung eingeführt, welche die Beurteilung der statistischen Signifikanz
eines Scores erlaubt.
Zusammen mit der inversen Screening-Methode wurden eine neue Evaluierungsstrategie
mit Evaluierungsdatensätzen entwickelt. Insgesamt erzielt iRAISE auf Basis von Bindemodusvorhersagen,
Target-Ranking und Laufzeit vielversprechende Ergebnisse.
Darüber hinaus wurden im Rahmen dieser Arbeit strukturbasierte, computergestützte Methoden
in einem biotechnologischen Projekt erfolgreich eingesetzt, in welchem ein synthetischer
Multienzym-Stoffwechselpfad entwickelt wurde. Dies hebt die Potentiale der Methode in
einem weiteren Anwendungsfeld neben dem Feld der Wirkstoffentwicklung, in welchem die
Nutzung dieser Methoden schon etabliert ist, hervor.

Zugriffsstatistik

keine Statistikdaten vorhanden
Legende