Zur Transkription mündlicher Phänomene in der politischen Sprache
Authors: Marcella Palladino
Abstract:
Dieser Beitrag befasst sich mit ASR-Transkripten außerparlamentarischer politischer gesprochener Kommunikation auf Deutsch, die mit dem Zweck erstellt werden, linguistische Analysen durchzuführen. Um gesprochene Dateien zu transkribieren, stellen ASR-Systeme vor allem im Falle großer Datenmengen oder langer Reden eine wichtige Ressource dar. Es ist bekannt, dass viele ASR-Systeme die Sprache tendenziell normalisieren, und in dieser Studie wird dargestellt und diskutiert, welche Probleme für linguistische Analysen entstehen können. Der Fokus liegt dabei spezifisch auf Phänomenen der Mündlichkeit wie Interjektionen und Füllwörtern, die in vielen Fällen keine eindeutig identifizierbaren lexikalischen Einheiten darstellen, aber trotzdem unerlässlicher Teil der Kommunikation sind. Diese Elemente werden von ASR-Systemen oft nicht erkannt, vor allem, wenn man öffentlich zugängliche Instrumente verwendet, wie sie in diesem Beitrag eingesetzt werden. Diese mündlichen Elemente besitzen allerdings in der politischen Sprache eine große Relevanz und sind für linguistische Analysen von großem Interesse. Der Beitrag veranschaulicht diese Problematik anhand von Beispielen und enthält die Diskussion sowohl über die Vorteile als auch die Herausforderungen ausgewählter öffentlich verfügbarer ASR-Systeme für die genannten Forschungszwecke. Abschließend wird die Hoffnung geäußert, dass die Dateien der außerparlamentarischen Kommunikation als Ressource für öffentliches aber gezieltes Modelltraining betrachtet werden können.


