ESSV Konferenz Elektronische Sprachsignalverarbeitung

Title: Konfidenzberechnung für automatische Labels

Authors: Frank Duckhorn, Rüdiger Hoffmann

Abstract:

Die automatische Generierung von zeitlichen Markierungen, sogenannten Labels, ist eine häufige Anwendung in der akustischen Mustererkennung. Sie wird zum Beispiel verwendet, um Sprachdatenbasen für das Training eines Spracherkenners oder für die Sprachsynthese zu annotieren. Aber auch bei technischen Signalen soll in vielen Fällen der Zeitpunkt bestimmter Ereignisse automatisch detektiert werden. Um dies zu erreichen, wird ein akustischer Mustererkenner verwendet und die zeitliche Referenz in dem akustischen Signal protokolliert, bei dem der Erkenner zwischen bestimmten Zuständen wechselt. Die Genauigkeit der Position der Labels hängt sehr stark von den verwendeten Daten sowie der Modellierbarkeit des gesuchten Ereignisses ab. Für Sprachsignale ist die Qualität meist ausreichend, einen guten Spracherkenner vorausgesetzt. Bei technischen Signalen ist die Bandbreite deutlich größer. Dieser Beitrag stellt ein Verfahren vor, welches den automatischen Labels eine Konfidenz zuordnet. Diese ermöglicht, die Genauigkeit eines Labels einschätzen zu können. Anhand von Anwendungsfällen wird deutlich, wie nützlich die Konfidenzberechnung für automatische Labels sein kann, um fehlerhafte Ergebnisse zu vermeiden.


Year: 2012
In session: Sprach- und Signalverarbeitung
Pages: 104 to 111