@InProceedings{Finster2004_511,
author = {Harald Finster and Hans-Günter Hirsch},
booktitle = {Studientexte zur Sprachkommunikation: Elektronische Sprachsignalverarbeitung 2004},
title = {Bestimmung der optimalen HMM-Parameter zur robusten, phonembasierten Spracherkennung},
year = {2004},
editor = {Klaus Fellbaum},
month = mar,
pages = {125--132},
publisher = {TUDpress, Dresden},
abstract = {Zur Erweiterung eines bestehenden Sprachdialogsystems, das bisher auf
einer wortbasierten Spracherkennung beruht, wird eine Modellierung von Wörtern
als Kette von Phonem HM-Modellen (Hidden Markov) untersucht. Es wird die
Abhängigkeit der Erkennungsgüte von der Anzahl der Zustände eines Modells sowie
die Anzahl der Gauß-Verteilungen ermittelt. Dies wird sowohl für eine Erkennung
isoliert gesprochener Kommandowörter als auch für Ziffernketten durchgeführt. Zur
Extraktion der akustischen Merkmale aus dem Sprachsignal werden die beiden von
ETSI standardisierten Verfahren eingesetzt. Neben einer Modellierung der Phoneme
als Monophone wird auch eine Modellierung als Triphone unter Berücksichtigung
der umgebenden Lautklassen betrachtet. Es lassen sich Wortfehlerraten unterhalb
von 1 % für die Aufgabe des Erkennens 50 verschiedener Kommandowörter sowie
Wortfehlerraten unterhalb von 3 % für eine Ziffernkettenerkennung erzielen. Bei im
Auto aufgenommenen, gestörten Ziffern liegt die Fehlerrate bei etwa 7 %.},
isbn = {978-3-937672-65-6},
issn = {0940-6832},
keywords = {Spracherkennung},
url = {https://www.essv.de/pdf/pdf/2004_125_132.pdf},
}