Mehrkanaliges akustisches Front-End für Spracherkennungssysteme

Thomas Fehér; Rico Petrick; Rüdiger Hoffmann

Mehrkanaliges akustisches Front-End für Spracherkennungssysteme

Authors: Thomas Fehér, Rico Petrick, Rüdiger Hoffmann

Abstract:

Mehrmikrofonanordnungen erweitern die Möglichkeiten der Vorverarbeitung von Audiosignalen für die Spracherkennung. Sie ermöglichen die Nutzung von Beamforming-Algorithmen, mit deren Hilfe Störgeräusche und Raumeinflüsse reduziert werden können. In diesem Beitrag werden verschiedene Beamformer vorgestellt und deren Vor- und Nachteile für die Spracherkennung diskutiert. Es wurden Messungen in praktisch relevanten Umgebungen vorgenommen, deren Auswirkung auf die Erkennungsrate hier gezeigt werden. Des Weiteren erfolgt die Vorstellung eines aktuellen Projektes des Institut für Akustik und Sprachkommunikation der TU Dresden mit mehreren Partnern zur Entwicklung eines public Terminals mit robuster Spracherkennung.

Year: 2009
In session: Signalverarbeitung
Pages: 135 to 141