FAQ
© 2015 Staats- und Universitätsbibliothek
Hamburg, Carl von Ossietzky

Öffnungszeiten heute09.00 bis 24.00 Uhr alle Öffnungszeiten

Eingang zum Volltext in OPUS

Hinweis zum Urheberrecht

Dissertation zugänglich unter
URN: urn:nbn:de:gbv:18-31988
URL: http://ediss.sub.uni-hamburg.de/volltexte/2007/3198/


Topologieoptimierung phonetischer Hidden-Markov-Modelle mittels Erkennungssimulation

Topology Optimizing of Phonetic Hidden Markov Models with Recognition Simulation

Knoblauch, Dirk

pdf-Format:
 Dokument 1.pdf (602 KB) 


SWD-Schlagwörter: Automatische Spracherkennung , Hidden-Markov-Modell
Basisklassifikation: 54.75
Institut: Informatik
DDC-Sachgruppe: Informatik
Dokumentart: Dissertation
Hauptberichter: Menzel, Wolfgang (Prof. Dr.)
Sprache: Deutsch
Tag der mündlichen Prüfung: 29.11.2006
Erstellungsjahr: 2006
Publikationsdatum: 05.02.2007
Kurzfassung auf Deutsch: Eine Grundlage für die Entwicklung leistungsfähiger
Spracherkennungssysteme ist die Modellierung geeigneter akustischer
Modelltopologien. In der vorliegenden Arbeit wird ein Verfahren vorgestellt,
welches verschiedene bestehende akustische monophone Modelltopologien anhand
von Spracherkennungssimulationen
qualitativ bewertet und somit Rückschlüsse auf einzelne Topologiegüten
zulässt.
Eine Spracherkennungs-Simulation erfolgt, indem theoretisch eine Dekodierung
errechnet wird, jedoch ohne dem System Echtdaten zur Verfügung zu stellen.
Durch die qualitative Bewertung wird eine akustische
Topologieoptimierung möglich.

Als Grundlage für die Versuche wird ein Verfahren
implementiert, welches anhand trainierter akustischer Modelle eine
qualitative Bewertung der untersuchten Modelltopologien zulässt.

Die durch das Verfahren optimierten Topologien werden mit bekannten
Topologien, die in der Spracherkennung eingesetzt werden, verglichen und diskutiert. Die
Resultate zeigen, dass es möglich ist, akustische Modelltopologien qualitativ zu
bewerten, ohne explizit Spracherkennungsergebnisse zu errechnen.
Durch die optimierten Modelltopologien ist es schließlich möglich, die Trainiertheit einzelner Phonmodelle und
damit mögliche Spracherkennungssysteme zu verbessern.

Zugriffsstatistik

keine Statistikdaten vorhanden
Legende