The Development of Nearly Deterministic Methods for Optimising Protein Geometry

Schenk, Gundolf

DC Element	Wert	Sprache
dc.contributor.advisor	Torda, Andrew (Prof. Dr.)
dc.contributor.author	Schenk, Gundolf
dc.date.accessioned	2020-10-19T12:50:50Z	-
dc.date.available	2020-10-19T12:50:50Z	-
dc.date.issued	2011
dc.identifier.uri	https://ediss.sub.uni-hamburg.de/handle/ediss/4447	-
dc.description.abstract	Proteins are long-chained biomolecules with distinctive functions, that take a major role in all living systems. The function is defined by the protein structure, which in turn is determined via a complicated mechanism based on the amino acid sequence. The exact procedure is not fully understood. However, knowing the structure is important for the pharmaceutical industry as well as bioengineering and nanotechnology. Unfortunately, determining it experimentally is slow and expensive. There is also much interest in being able to adapt the sequence to make stable industrial enzymes or to form molecules with specialised shapes, e.g. for biosensors. Predicting a structure computationally from the sequence is a classic problem in theoretical biochemistry, that has not been solved yet. In this work the emphasis lies in methodological improvements, that avoid common chemical preconceptions. A general method for building numerical models is developed and analysed here. It is based on a statistical correlation scheme of sequence and structure using ideas from self-consistent mean field (SCMF) optimisation. The procedure is successfully applied to the structure prediction and sequence design problems without using a Boltzmann formalism. The statistical model is based on a mixture distribution of bivariate Gaussian and 20-way Bernoulli distributions. The Gaussian distributions model the continuous variables of the structure (dihedral angles) and the Bernoulli distributions capture the sequence propensities. Instead of treating the protein as a statistical unit, easier to handle fragments are used. Several approaches to recombine them are discussed. But the fragments form local statistical units that do not necessarily agree with each other. A method suited to deal with such inconsistencies is SCMF optimisation. Mean field or SCMF methods optimise a system by treating all solution states at the same time. In existing approaches, an energy potential was introduced that reflects the pairwise mean interaction between subsystems. The state weights of the subsystems were converted alternately into energies and probabilities by applying the Boltzmann relation repeatedly until a self-consistent state for the whole system is reached. With the approach presented here it is possible to optimise the state probabilities directly. The Boltzmann distribution is essentially an unnecessary assumption. Therefore, the method is also applicable to systems with an unknown ensemble.	en
dc.description.abstract	Proteine sind langkettige Biomoleküle mit charakteristischen Funktionen, die eine Hauptrolle in allen Lebewesen einnehmen. Diese Funktion ergibt sich aus der Proteinstruktur, die wiederum durch einen komplizierten Mechanismus basierend auf der Aminosäuresequenz bestimmt wird. Der genaue Vorgang ist nicht vollständig verstanden, aber die Strukturen zu kennen ist wichtig f¨ur die pharmazeutische Industrie, sowie für die Bio- und Nanotechnologie. Leider ist es langsam und teuer sie experimentell zu bestimmen. Hohes Interesse besteht auch daran die Sequenz anzupassen um stabile industrielle Enzyme zu machen oder um Moleküle mit speziellen Formen herzustellen, z.B. für Biosensoren. Eine Struktur am Computer anhand der Sequenz vorherzusagen ist ein klassisches Problem der theoretischen Biochemie, welches bisher nicht gelöst wurde. In dieser Arbeit liegt der Schwerpunkt auf methodologischen Verbesserungen, die verbreitete chemische Annahmen vermeiden. Eine allgemeine Methode zur Erstellung numerischer Modelle wird hier entwickelt und analysiert. Sie basiert auf einem statistischen Korrelationsmodell von Sequenz und Struktur und benutzt Ideen aus der selbst-konsistenten Mittelfeld (SCMF) Optimierung. Das Verfahren lässt sich erfolgreich auf die Strukturvorhersage- und Sequenzdesignprobleme anwenden ohne eine Boltzmann Statistik anzunehmen. Das statistische Modell basiert auf einer Mischverteilung von bivariaten Gaußverteilungen und 20-wege Bernoulliverteilungen. Die Gaußverteilungen modellieren die kontinuierlichen Variablen der Proteinstruktur (Torsionswinkel) und die Bernoulliverteilungen erfassen die Sequenzpräferenzen. Anstelle ein Protein als statistische Einheit zu verstehen, werden hier leichter zu verarbeitende Fragmente betrachtet. Mehrere Ansätze sie wieder zusammenzusetzen werden diskutiert. Aber die Fragmente bilden lokale statistische Einheiten, die nicht notwendiger Weise miteinander übereinstimmen. Ein passendes Verfahren solche Inkonsistenzen zu behandeln, ist die SCMF Optimierung. Mittelfeld oder SCMF Verfahren betrachten das zu optimierende System in allen Lösungszuständen gleichzeitig. In bestehenden Ansätzen wurde dazu ein Energiepotential erstellt, das gemittelte, paarweise Wechselwirkungen zwischen Untersystemen abbildet. Die Zustandsgewichte der Untersysteme wurden durch wiederholte Anwendung des Boltzmannverh¨altnisses alternierend in Energien und Wahrscheinlichkeiten umgerechnet bis ein selbst-konsistenter Zustand des gesamten Systems erreicht wird. Mit dem hier präsentierten Ansatz ist es möglich die Zustandswahrscheinlichkeiten direkt zu optimieren. Die Boltzmannverteilung ist keine notwendige Annahme. Daher ist die Methode auch auf Systeme mit unbekanntem Ensemble anwendbar.	de
dc.language.iso	en	en
dc.publisher	Staats- und Universitätsbibliothek Hamburg Carl von Ossietzky
dc.rights	http://purl.org/coar/access_right/c_abf2
dc.subject	protein modelling	en
dc.subject	statistical scoring	en
dc.subject	structure prediction	en
dc.subject	sequence optimisation	en
dc.subject	self-consistent mean field	en
dc.subject	simulated annealing	en
dc.subject.ddc	500 Naturwissenschaften
dc.title	The Development of Nearly Deterministic Methods for Optimising Protein Geometry	en
dc.title.alternative	Die Entwicklung nahezu deterministischer Methoden zur Optimierung der Protein Geometrie	de
dc.type	doctoralThesis
dcterms.dateAccepted	2012-03-28
dc.rights.cc	No license
dc.rights.rs	http://rightsstatements.org/vocab/InC/1.0/
dc.subject.bcl	30.03 Methoden und Techniken in den Naturwissenschaften
dc.subject.bcl	35.05 Mathematische Chemie, chemische Statistik
dc.subject.bcl	35.79 Biochemie: Sonstiges
dc.subject.bcl	42.10 Theoretische Biologie
dc.subject.bcl	54.99 Informatik: Sonstiges
dc.subject.gnd	Bioinformatik
dc.type.casrai	Dissertation	-
dc.type.dini	doctoralThesis	-
dc.type.driver	doctoralThesis	-
dc.type.status	info:eu-repo/semantics/publishedVersion
dc.type.thesis	doctoralThesis
tuhh.opus.id	5633
tuhh.opus.datecreation	2012-05-07
tuhh.type.opus	Dissertation	-
thesis.grantor.department	Informatik
thesis.grantor.place	Hamburg
thesis.grantor.universityOrInstitution	Universität Hamburg
dcterms.DCMIType	Text	-
tuhh.gvk.ppn	717637441
dc.identifier.urn	urn:nbn:de:gbv:18-56333
item.advisorGND	Torda, Andrew (Prof. Dr.)	-
item.grantfulltext	open	-
item.creatorOrcid	Schenk, Gundolf	-
item.fulltext	With Fulltext	-
item.creatorGND	Schenk, Gundolf	-
item.languageiso639-1	other	-
Enthalten in den Sammlungen:	Elektronische Dissertationen und Habilitationen

Dateien zu dieser Ressource:

Datei	Beschreibung	Prüfsumme	Größe	Format
Dissertation.pdf		d4357539dceb27f6ac52e6f7d30a8a53	6.66 MB	Adobe PDF	Öffnen/Anzeigen

Zur Kurzanzeige

Diese Publikation steht in elektronischer Form im Internet bereit und kann gelesen werden. Über den freien Zugang hinaus wurden durch die Urheberin / den Urheber keine weiteren Rechte eingeräumt. Nutzungshandlungen (wie zum Beispiel der Download, das Bearbeiten, das Weiterverbreiten) sind daher nur im Rahmen der gesetzlichen Erlaubnisse des Urheberrechtsgesetzes (UrhG) erlaubt. Dies gilt für die Publikation sowie für ihre einzelnen Bestandteile, soweit nichts Anderes ausgewiesen ist.

Info

Seitenansichten

452

Letzte Woche

Letzten Monat

geprüft am 25.02.2026

Download(s)

169

Letzte Woche

Letzten Monat

geprüft am 25.02.2026

Werkzeuge

Google Scholar^TM

Prüfe

Dateien zu dieser Ressource:

Seitenansichten

Download(s)

Google ScholarTM

Google Scholar^TM