@InProceedings{Winkler2010_539,
author = {Ralf Winkler and Gunter Uhlmann and Gerd Schneider},
booktitle = {Studientexte zur Sprachkommunikation: Elektronische Sprachsignalverarbeitung 2010},
title = {Maschinelle Klassifikation von Artikulationsbewegungen im Rahmen einer visuellen Artikulationsschulung für gehörlose und schwerhöriger Kinder},
year = {2010},
editor = {Hansjörg Mixdorff},
month = mar,
pages = {48--55},
publisher = {TUDpress, Dresden},
abstract = {Unterschiedliche technische Hilfsmittel wurden entwickelt, um gehörlose
und profund schwerhörige Kindern beim Erlernen der Lautsprache zu unterstützen.
Die Systeme sind in der Lage, selbstständig, ohne Eingriff eines Therapeuten,
den Erfolg einer Äußerung zu bewerten. Probleme bereitet dagegen allen
Systemen die Erzeugung von Hinweisen zur Korrektur im Falle von Misserfolg.
Es wird untersucht, in welchem Maße Bewegungen der äußeren Artikulatoren zur
Erzeugung von Hinweisen zur Korrektur von Sprechbewegungen geeignet sind.
Ein Schema für eine explizite Repräsentation korrekter Artikulation wird vorgeschlagen
und anhand der Vokale des Deutschen evaluiert. Anhand einer großen
Anzahl von Bewegungsdaten eines Sprechers sowie von insgesamt 14 Sprechern
wird getestet, in welchem Maße diese explizite Repräsentation geeignet ist, zwischen
korrekten und defizitären Artikulationen zu unterscheiden.
Die Ergebnisse der Analysen der Bewegungsdaten eines einzelnen Sprechers zeigen,
dass die explizite Repräsentation nahezu fehlerfrei sechs Vokalgruppen abbildet.
Hieraus lässt sich der Schluss ziehen, dass die hier definierten artikulatorischen
Merkmale grundsätzlich zur Spezifikation der verwendeten Vokalgruppen
geeignet sind. Die Klassifikation der Bewegungsdaten von zusammen 14 Sprechern
ist trotz auftretender Verwechslungen ebenfalls gut. Dieses Ergebnis zeigt, dass eine
sprecher-unabhängige Repräsentation von Artikulationen nach dem hier vorgeschlagenen
Schema möglich ist. Da das Ziel der trainierenden Kinder das Erzeugen
verständliche Sprache ist, sollte die Bewertung des Erfolges weiterhin primär
auf der Ebene des Audiosignals erfolgen. Das hier vorgeschlagene Schema könnte
von einem technischen System verwendet werden, bei Defiziten durch Vergleich
zwischen Sprechbewegung und hier vorgeschlagener Repräsentation selbstständig
Hinweise zur Korrektur der Sprechbewegung an den Lerner zu generieren.},
isbn = {978-3-941298-85-9},
issn = {0940-6832},
keywords = {Multimodal Communication},
url = {https://www.essv.de/pdf/2010_48_55.pdf},
}