FAQ
© 2015 Staats- und Universitätsbibliothek
Hamburg, Carl von Ossietzky

Öffnungszeiten heute09.00 bis 24.00 Uhr alle Öffnungszeiten

Eingang zum Volltext in OPUS

Hinweis zum Urheberrecht

Dissertation zugänglich unter
URN: urn:nbn:de:gbv:18-62377
URL: http://ediss.sub.uni-hamburg.de/volltexte/2013/6237/


Computational Gene Structure Prediction

Rechnergestützte Genstrukturvorhersage

Gremme, Gordon

pdf-Format:
 Dokument 1.pdf (1.088 KB) 


SWD-Schlagwörter: Bioinformatik
Freie Schlagwörter (Deutsch): Genomannotation , Genstrukturvorhersage
Freie Schlagwörter (Englisch): genome annotation , gene structure prediction
Basisklassifikation: 54.89
Institut: Informatik
DDC-Sachgruppe: Informatik
Dokumentart: Dissertation
Hauptberichter: Kurtz, Stefan (Prof. Dr.)
Sprache: Englisch
Tag der mündlichen Prüfung: 15.05.2013
Erstellungsjahr: 2012
Publikationsdatum: 04.07.2013
Kurzfassung auf Englisch: Modern molecular biology research is characterized by the availability of an increasing amount of biological data which is often fuzzy due to the nature of the experimental methods used to derive it. Bioinformatics, a branch of computer science, deals with the storage, retrieval, and analysis of this data. DNA, the basic information carrier of life, is now sequenced industrially in large quantities and assembled to complete genomes. The automatic annotation of genes in these genomes, a process called computational gene structure prediction, is the scope of this thesis.
This dissertation describes the computational gene structure prediction software GenomeThreader which uses homologous biological sequences (so-called cDNAs/ESTs and/or protein sequences) to predict gene structures by computing spliced alignments. GenomeThreader uses a multi-phase approach, filtering the possibly very large sequence data sets in early phases to obtain promising gene candidates which are then refined by more computationally expensive algorithms in later phases. The results of this gene structure predictions, genome annotations, can become quite large and cumbersome to process. To deal with such annotations easily and efficiently, the GenomeTools genome analysis system has been developed, which is also described in this thesis.
The prediction quality of GenomeThreader was evaluated on a variety of datasets and the results show that the software performs very well on common gene structure prediction tasks. The quality of the results is comparable with the results of the best other programs and in some cases it is even better. The software is very easy to use due to its integrated nature, a feature which distinguishes it from its competitors. GenomeThreader has been adopted widely in the scientific community, it has approx. 150 users world-wide and over 30 publications cite the scientific article which describes an earlier version of the software. The open source package GenomeTools was used as a foundation for 10 published sequence and annotation processing tools.
Kurzfassung auf Deutsch: Moderne molekularbiologische Forschung ist durch die Verfügbarkeit stetig wachsender Datenmengen charakterisiert. Diese Daten sind auf Grund der experimentellen Methoden, die sie erzeugen, oftmals fehlerbehaftet. Die Bioinformatik, ein Teilbereich der Informatik, beschäftigt sich damit molekularbiologische Daten zu speichern, abzurufen und zu analysieren. DNA, der grundlegende Informationsträger des Lebens, wird heutzutage im industriellen Maßstab sequenziert und zu kompletten Genomen zusammengefügt. Diese Disseration befasst sich mit der automatische Annotation von Genen in vollständig sequenzierten Genomen, ein Prozess der rechnergestützte Genstrukturvorhersage genannt wird.
Diese Dissertation beschreibt die Methoden und Techniken, die die Grundlage der Genstrukturvorhersagesoftware GenomeThreader bilden. GenomeThreader benutzt homologe biologische Sequenzen (sogenannte cDNA/EST und/oder Proteinsequenzen) und berechnet Spliced Alignments, die Genstrukturen beschreiben. Zur Vorhersage der Genstrukturen wird ein mehrphasiger Ansatz benutzt. Dabei werden die unter Umständen sehr großen Sequenzdatenmengen in frühen Phasen auf vielversprechende Genkandidaten reduziert, die dann in späteren Phasen durch rechenaufwendigere Algorithmen verfeinert werden. Die Resultate dieser Genstrukturvorhersagen, die Genomannotationen, können sehr umfangreich werden und aufwendige Schritte der Weiterverarbeitung erfordern. Um mit solchen Annotationen einfach und effizient umgehen zu können, wurde das GenomeTools Genomanalysesystem entwickelt, das ebenfalls in dieser Arbeit beschrieben wird.
Die Vorhersagequalität von GenomeThreader wurde auf verschiedenen Datensätzen evaluiert. Es zeigt sich, dass GenomeThreader für die üblichen Genvorhersageaufgaben sehr gute Ergebnisse liefert. Die Qualität der Ergebnisse ist vergleichbar mit den Ergebnissen der besten anderen Programme und teilweise sogar besser. Durch die gelungene Integration der einzelnen Phasen ist die Software sehr einfach zu benutzen, eine Eigenschaft, die sie von ihren Wettbewerbern unterscheidet. GenomeThreader hat weite Verbreitung in der Wissenschaftsgemeinde gefunden. Es gibt ca. 150 Nutzer weltweit und 30 Publikationen zitieren den wissenschaftlichen Artikel, der eine frühe Version der Software beschreibt. Das quelloffene Softwarepaket GenomeTools diente als Grundlage für 10 weitere publizierte Werkzeuge zur Sequenz- und Annotationsverarbeitung.

Zugriffsstatistik

keine Statistikdaten vorhanden
Legende