@InProceedings{Kitzig2011_29,
author = {Andreas Kitzig and Hans-Günter Hirsch},
booktitle = {Studientexte zur Sprachkommunikation: Elektronische Sprachsignalverarbeitung 2011.},
title = {Evaluierung der Leistungsfähigkeit von Spracherkennungssystemen in Geräten der Kommunikationstechnik},
year = {2011},
editor = {Bernd J. Kröger and Peter Birkholz},
month = mar,
pages = {164--171},
publisher = {TUDpress, Dresden},
abstract = {Bei der Entwicklung von Spracherkennungssystemen, die in einer
gest¨orten akustischen Umgebung eingesetzt werden sollen, wird zur Evaluation
der Spracherkennungsleistung eine Vielzahl an Erkennungsexperimenten durchgef
¨uhrt. Dabei werden im Rahmen von Simulationsexperimenten ungest¨orte und
gest¨orte Sprachaufnahmen aus unterschiedlichen St¨orumgebungen verwendet. H¨aufig
wird die Erkennungsleistung der entwickelten Systeme mit der Erkennungsleistung
bereits vorhandener Systeme verglichen. Diese Schritte zur Evaluation
werden durchgefu¨hrt, um einen U¨ berblick u¨ber die Leistungsfa¨higkeit der entwickelten
Systeme in den einzelnen St¨orszenarien zu erlangen und eine Einordnung
im Vergleich zu den bereits vorhandenen Systemen vornehmen zu k¨onnen. In der
vorgestellten Untersuchung wird die Leistung zweier im Rahmen fr ¨uherer Arbeiten
entwickelter, robuster Erkennungssysteme mit der Leistungsf¨ahigkeit von Erkennungssystemen
verglichen, die als integraler Bestandteil einiger kommerziell
verf¨ugbarer Ger¨ate aus dem Bereich der Kommunikationstechnik eingesetzt werden.
Eines der beiden im Labor entwickelten Erkennungssysteme basiert auf einer
Extraktion robuster akustischer Merkmale, das andere basiert auf einer Adaption
der Referenzmuster auf die jeweiligen akustischen Bedingungen bei der Spracheingabe.
Bei den Ger¨aten aus dem Bereich der Kommunikationstechnik handelt es
sich um Systeme, die ¨uber eine Option zur Spracherkennung von Ziffern und Ziffernketten
zum Aufbau einer Telefonverbindung verf¨ugen. Zur Durchf¨uhrung von
Experimenten mit den kommerziell verf¨ugbaren Ger¨aten wurde ein Testaufbau entwickelt,
mit dem man in einem reflexionsarmen Raum dieWorterkennungsraten bei
gesprochenen Folgen von Ziffern bestimmen kann. Zuerst wird eine U¨ bersicht u¨ber
die selbstentwickelten robusten Erkennungssysteme gegeben. Anschließend werden
die verwendeten Ger¨ate und deren Funktionsumfang sowie der Testaufbau der
Experimente und die Testdaten vorgestellt. Abschließend erfolgt die Darstellung
der Ergebnisse der Tests sowie deren Bewertung.},
isbn = {978-3-942710-37-4},
issn = {0940-6832},
keywords = {Poster zu verschiedenen Themenbereichen},
url = {https://www.essv.de/pdf/2011_164_171.pdf},
}