@InProceedings{Draxler2025_1246,
author = {Christoph Draxler and Felicitas Kleber and Sven Grawunder and Jurgen Trouvain},
booktitle = {Studientexte zur Sprachkommunikation: Elektronische Sprachsignalverarbeitung 2025},
title = {Teilautomatisierter Workflow zur Aufbereitung grosser Audiodatenmengen für Signalbasierte Analysen},
year = {2025},
editor = {Sven Grawunder},
month = mar,
pages = {138--145},
publisher = {TUDpress, Dresden},
abstract = {Dieser Beitrag stellt eine teilautomatisierte Aufbereitung umfangreicher Audiodatenmengen für phonetisch-linguistische Korpora vor. Im konkreten
Projekt handelt es sich um Nachrichtensendungen, die in großer Zahl täglich produziert werden und sich aufgrund sprechstilistischer Ähnlichkeiten besonders gut
für linguistische und phonetische Analysen anbieten. Der Workflow umfasst u. a.
eine orthographische Transkription mittels automatischer Spracherkennung, deren
Prüfung und Vorsegmentierung im webbasierten Transkriptionseditors Octra, der
auch das anschließende Schneiden in Einzeldateien ermöglicht, sowie die automatische Segmentierung auf phonetischer Ebene und Speicherung der Daten in diversen Outputformaten mittels der BAS Webservices. Die hier erstmals größere und
dokumentierte Verwendung des Octra-Backends wird u.a. durch Bearbeitungszeiten evaluiert.},
isbn = {978-3-95908-803-9},
issn = {0940-6832},
keywords = {Multilingual Speech and Language Data Processing},
url = {https://www.essv.de/pdf/2025_138_145.pdf},
}