Gut und günstig? Nutzung des Google Speech API in Sprachdialogsystemen

Authors: Stefan Schmidt

Abstract:

Eine Untersuchung der Erkennungsleistung des Google Speech API (GS-API) f¨ur die deutsche Sprache, ergab eine Wortfehlerrate (WER) von 27%. 1010 Äußerungen, aus der Domäne Smart Home Environment, mit insgesamt 3.317 Wörtern wurden von 20 Versuchsteilnehmern eingesprochen. In der Auswertung zeigte sich der Effekt, dass die WER bei weiblichen Sprechern um 7,8% höher liegt als bei Männern. Die Antwortzeit des API liegt bei 600−400 ms pro Wort einer Äußerung. Weiterhin wird gezeigt wie sich das GS-API sowohl aus einem Webbrowser – als auch einer selbst implementierten Anwendung – heraus nutzen lässt. Im Rahmen der dieser Arbeiten wurde ein Java-basierter Client implementiert, welcher der Allgemeinheit zur Verfügung gestellt wird.


Year: 2012
In session: Sprachtechnologie und Anwendungen
Pages: 339 to 346