@InProceedings{Weiss2018_406,
author = {Benjamin Weiss and Thilo Michael and Stefan Hillmann},
booktitle = {Studientexte zur Sprachkommunikation: Elektronische Sprachsignalverarbeitung 2018},
title = {Kontinuierliche Schätzung von Sprechgeschwindigkeit mit einem Rekurrenten Neuronalen Netzwerk},
year = {2018},
editor = {André Berton and Udo Haiber and Wolfgang Minker},
month = mar,
pages = {186--191},
publisher = {TUDpress, Dresden},
abstract = {Um händische Segmentation bei der Analyse von Tempo aus Sprachaufnahmen zu vermeiden, können automatische Spracherkenner oder Verfahren wie das Praat-Skript von de Jong und Wempe 2009 verwendet werden. Als Ersatz wurde ein Verfahren für die kontinuierliche Schätzung von Sprechtempo entwickelt, das nicht wie automatische Spracherkenner auf ein Sprachmodell zurückgreifen muss, und dennoch praktikabler als das etablierte Praat-Skript ist, da es die Sprechzeit präziser berücksichtigt. Unser Ansatz nutzt ein rekurrentes neuronales Netz mit LSTM Zellen und wurde mit ca. 70% des Kiel Korpus trainiert. Das resultierende Modell schätzt die verbleibenden 30% Testdaten mit r=0,9.},
isbn = {978-3-959081-28-3},
issn = {0940-6832},
keywords = {Speech Processing and Prosody},
url = {https://www.essv.de/pdf/2018_186_191.pdf},
}