Das Prosodisch-Phonetische Annotationssystem PROPHANO

Abstract:

Umfang und Qualität gesammelter Sprachdaten haben einen maßgeblichen Einfluss auf die Entwicklung von Sprachverarbeitungssystemen. Aufgrund der notwendigen Datenvolumen wird eine automatische Segmentierung und Annotation der Sprachdaten angestrebt. In der Praxis ist in der Regel eine manuelle Kontrolle und Korrektur der Daten erforderlich. Das Prosodisch-Phonetische Annotationssystem PROPHANO stellt weitgehend automatisierte Werkzeuge zur Verfügung, deren Zusammenschaltung zu einer zuverlässigen Segmentierung und Annotation aufgezeichneter Sprachdaten führt und gleichzeitig das für die manuelle Korrektur notwendige Expertenwissen in den Algorithmen abbildet. Somit kann auch der weniger erfahrene Bearbeiter hochwertige Sprachdatenbasen erstellen. PROPHANO basiert auf Vorarbeiten des Instituts im Bereich hochqualitativer Sprecherdaten für die Sprachsynthese (TC-STAR [1]) sowie bei der webgestützten Datensammlung von SMS-Texten und dementsprechenden Studioaufnahmen [2]. Vorhandene Werkzeuge zur Aufnahme und Phonemsegmentierung, z. B. WiGE [3], werden verwendet und mit einer prosodischen Analysemöglichkeit erweitert. PROPHANO integriert die Sprachdatenannotation in eine übersichtliche XMLStruktur, welche eine synchrone oder asynchrone Weiterverarbeitung der Sprachdaten erleichtert und für neue Sprachmerkmale erweiterbar ist.


Year: 2010
In session: Prosody and Affect
Pages: 71 to 76