@InProceedings{Draxler2025_1246,
author = {Christoph Draxler and Felicitas Kleber and Sven Grawunder and Jurgen Trouvain},
booktitle = {Studientexte zur Sprachkommunikation: Elektronische Sprachsignalverarbeitung 2025},
title = {Teilautomatisierter Workflow zur Aufbereitung grosser Audiodatenmengen für Signalbasierte Analysen},
year = {2025},
editor = {Sven Grawunder},
month = mar,
pages = {138--145},
publisher = {TUDpress, Dresden},
abstract = {Dieser Beitrag stellt eine teilautomatisierte Aufbereitung umfangreicher Audiodatenmengen für phonetisch-linguistische Korpora vor. Im konkreten Projekt handelt es sich um Nachrichtensendungen, die in großer Zahl täglich produziert werden und sich aufgrund sprechstilistischer Ähnlichkeiten besonders gut für linguistische und phonetische Analysen anbieten. Der Workflow umfasst u. a. eine orthographische Transkription mittels automatischer Spracherkennung, deren Prüfung und Vorsegmentierung im webbasierten Transkriptionseditors Octra, der auch das anschließende Schneiden in Einzeldateien ermöglicht, sowie die automatische Segmentierung auf phonetischer Ebene und Speicherung der Daten in diversen Outputformaten mittels der BAS Webservices. Die hier erstmals größere und dokumentierte Verwendung des Octra-Backends wird u.a. durch Bearbeitungszeiten evaluiert.},
isbn = {978-3-95908-803-9},
issn = {0940-6832},
keywords = {Multilingual Speech and Language Data Processing},
url = {https://www.essv.de/pdf/2025_138_145.pdf},
}