ESSV Konferenz Elektronische Sprachsignalverarbeitung

Title: Performanzuntersuchungen zur Stimmkonvertierung

Authors: Oliver Jokisch, Hamurabi Gamboa Rosales

Abstract:

Es haben sich unterschiedliche Verfahren zur Stimmkonvertierung etabliert, um die angestrebte Charakteristik eines Zielsprechers zu modellieren und dabei eine möglichst natürliche Sprachsignalqualität zu gewährleisten. Der Beitrag stellt Hörexperimente für vier Stimmkonvertierungsmethoden vor, bei denen die Höranstrengung, die allgemeine Sprachqualität und die Ähnlichkeit zur Zielstimme bewertet werden. Die subjektive Ähnlichkeitsbewertung wird mittels einer objektiven Abstandsmessung auf Basis der logarithmierten Spektralverzerrung überprüft. Der praktische Einsatz des Konvertierungsverfahrens erfordert darüber hinaus eine geeignete Performanz bezüglich des Laufzeitverhaltens sowie der Speichernutzung. Der Beitrag diskutiert das Laufzeitverhalten auf Basis verschiedener Parametrisierungen einer ausgewählten Stimmkonvertierungsmethode im Kontexttypischer Einsatzbedingungen. Dabei wird der Einfluss der Rechenressourcen, der Konvertierungsparameter sowie der Trainingseinstellungen getestet. Der ermittelte Echtzeitfaktor der nicht-optimierten Konvertierungsmethode ist für viele kommerzielle Anwendungen ungeeignet.


Year: 2011
In session: Sprachsignalverarbeitung, Spracherkennung und Sprachsynthese II
Pages: 349 to 356