ESSV Konferenz Elektronische Sprachsignalverarbeitung

Title: Wiedererkennbarkeit von Sprechern bei schmal- und breitbandiger Telefonübertragung

Authors: Sebastian Möller, Laura Fernández Gallardo, Michael Wagner

Abstract:

In diesem Beitrag wird diskutiert, wie sich die Erkennbarkeit von Sprechern beim Übergang von schmalbandiger auf breitbandige oder superbreitbandige Telefonübertragung verbessert. Dazu wurde zunächst ein Versuchsparadigma definiert, bei dem innerhalb einer Gruppe bekannte Sprecher von Versuchspersonen auf Basis von Segmenten unterschiedlicher Länge identifiziert werden sollten. Es zeigt sich, dass sich die Erkennbarkeit mit der Kanalbandbreite signifikant verbessert. Allerdings können diese Verbesserungen teilweise durch inhärente Kanalbeeinträchtigungen (Kodierer, Endgeräte) wieder reduziert werden. In einer zweiten Versuchsreihe wurde untersucht, wie sich die maschinelle Sprechererkennung durch den verbreiterten Kanal ändert. Es zeigt sich wiederum eine Reduktion der Equal Error Rate, die je nach Erkennungsparadigma unterschiedlich deutlich ausfällt. Die Ergebnisse werden in einen Zusammenhang mit der erzielbaren Verbesserung der Gesamtqualität, der Sprachverständlichkeit und der Erkennbarkeit paralinguistischer Merkmale gebracht, um somit ein umfassendes Bild der erzielbaren Verbesserungen zu bekommen.


Year: 2015
In session: Spracherkennung
Pages: 97 to 104