Optimierung der Numerik eines linearen Gleichungssystems für die Simulation des Schallfeldes im Vokaltrakt

Abstract:

Im Gegensatz zur in Forschung und Industrie weit verbreiteten konkatenativen Sprachsynthese besitzt die artikulatorische Sprachsynthese alle Freiheiten, die auch ein natürlicher Sprechapparat besitzt. Durch die vollständige aeroakustische Simulation der Sprache entsteht nachteilig ein hoher Rechenaufwand. Maßgeblich ist die Berechnung eines großen linearen Gleichungssystems (LGS) zur Simulation des Schallfeldes im Vokaltrakt. Um die Berechnungszeit zu reduzieren wurden für den artikulatorischen Sprachsynthesizer VocalTractLab verschiedene numerische Verfahren, Vorkonditionierungen und Speicherstrategien untersucht. Insgesamt ist es gelungen, mittels der Cholesky-Zerlegung und einer auf den Algorithmus sowie auf das LGS angepassten Speichermethode die Berechnungszeit um das Fünf- bis Sechsfache gegenüber dem bisher verwendeten Gauß-Seidel-Relaxationsverfahren zu verkürzen. Verglichen mit der Dauer des simulierten akustischen Signals nimmt die Berechnung des LGS nur noch ca. die Hälfte der simulierten Zeit in Anspruch - womit die gesamte Synthese deutlich näher an die Echtzeitfähigkeit rückt und auf aktueller PC-Hardware einen Echtzeitfaktor von 2 erreicht (vgl. vorher 4,5).


Year: 2018
In session: Speech Synthesis
Pages: 359 to 366