@InProceedings{Finster2004_511,
author = {Harald Finster and Hans-Günter Hirsch},
booktitle = {Studientexte zur Sprachkommunikation: Elektronische Sprachsignalverarbeitung 2004},
title = {Bestimmung der optimalen HMM-Parameter zur robusten, phonembasierten Spracherkennung},
year = {2004},
editor = {Klaus Fellbaum},
month = mar,
pages = {125--132},
publisher = {TUDpress, Dresden},
abstract = {Zur Erweiterung eines bestehenden Sprachdialogsystems, das bisher auf einer wortbasierten Spracherkennung beruht, wird eine Modellierung von Wörtern als Kette von Phonem HM-Modellen (Hidden Markov) untersucht. Es wird die Abhängigkeit der Erkennungsgüte von der Anzahl der Zustände eines Modells sowie die Anzahl der Gauß-Verteilungen ermittelt. Dies wird sowohl für eine Erkennung isoliert gesprochener Kommandowörter als auch für Ziffernketten durchgeführt. Zur Extraktion der akustischen Merkmale aus dem Sprachsignal werden die beiden von ETSI standardisierten Verfahren eingesetzt. Neben einer Modellierung der Phoneme als Monophone wird auch eine Modellierung als Triphone unter Berücksichtigung der umgebenden Lautklassen betrachtet. Es lassen sich Wortfehlerraten unterhalb von 1 % für die Aufgabe des Erkennens 50 verschiedener Kommandowörter sowie Wortfehlerraten unterhalb von 3 % für eine Ziffernkettenerkennung erzielen. Bei im Auto aufgenommenen, gestörten Ziffern liegt die Fehlerrate bei etwa 7 %.},
isbn = {978-3-937672-65-6},
issn = {0940-6832},
keywords = {Spracherkennung},
url = {https://www.essv.de/pdf/pdf/2004_125_132.pdf},
}