KorpusDress1 - Korpusbasierte konkatenative Sprachsynthesesysteme

Abstract:

Korpusbasierte Sprachsynthesesysteme haben eine hohe Qualität in der Sprachsynthese gezeigt. Dies ist möglich wegen der guten Leistung der Bausteinauswahl in den Sprachsynthesesystemen[1], in denen es das Hauptziel der Bausteinauswahl ist, die beste Kombination der Sprachbausteine zu finden, um den Wahrnehmungsunterschied zwischen dem erwarteten und synthetisierten Sprachsignal so minimal wie möglich zu erhalten. Aber die Bestimmung der Strategie der Bausteinauswahl und das Tuning der Parameter sind noch schwierige Herausforderungen. Dieses Paper beschreibt die Version 1 des KorpusDress Sprachsynthesesystems (TTS). Das System stellt die Bedingungen der Entwicklung für die korpusbasierte konkatenatenative Sprachsynthese mit nicht-gleichförmigen Sprachbausteinen zur Verfügung. Wir diskutieren die verschiedenen Aspekte der nicht-gleichförmigen Sprachbausteinauswahl und konzentrieren uns auf die Erforschung der Themen, die auf den Entwurf der Korpusdatenbank bezogen sind: die Suche der längsten Sprachbausteine und der Ziel- und Verkettungskosten in der Bausteinauswahl. Zusätzlich stellen wir eine Strategie dar, um die Leistungsfähigkeit der vollständig gewichteten Koeffizientensuche durch ein statistisches Training und Perzeptronnetze zu erhöhen. Das statistische Training, Techniken, die an einem großen Korpus verwenden wurden, wird verwendet, um die Entscheidung über vorausgesagte Sprachfälle und ausgewählte Sprachbausteine der Korpusdatenbank zu treffen. Am Ende beschleunigen das Design der Korpusdatenbank und die nichtgleichförmige Sprachbausteinauswahl des TTS Systems die Entwicklungs- und Laufzeit des TTS und verbessern die Sprachqualität.


Year: 2007
In session: Sprachsynthese
Pages: 115 to 122