@InProceedings{Bitterlich2025_1263,
author = {Robin Bitterlich and Oliver Jokisch and Ullrich Prax and Rocco Zimmermann},
booktitle = {Studientexte zur Sprachkommunikation: Elektronische Sprachsignalverarbeitung 2025},
title = {Experimente zur Transkription von Verwaltungsbesprechungen und domänenangepasste Ergebnisprotokollierung},
year = {2025},
editor = {Sven Grawunder},
month = mar,
pages = {281--288},
publisher = {TUDpress, Dresden},
abstract = {Für eine sachgerechte Dokumentation des Verwaltungshandelns und
rechtssichere Verwaltungsentscheidungen sind bei jeder Besprechung die wichtigsten
Ergebnisse zu erfassen. Die Dokumentation erfolgt verwaltungstypisch durch manuell
erstellte, schriftliche Ergebnisprotokolle, deren Erstellung zeitintensiv ist. Fachlich involvierte Mitarbeitende sind oft selbst am Gespräch beteiligt und stehen nur bedingt
für die Protokollierung zur Verfügung. Eine Beteiligung weiterer Sachverständiger ist
häufig unwirtschaftlich. Methoden der künstlichen Intelligenz (KI) erleichtern eine
Optimierung und Automatisierung von Geschäftsprozessen in der öffentlichen Verwaltung. Im Forschungsprojekt „Verwaltungs-ERgebnisprotokoll Assistenz“ (VERA)
werden vortrainierte Large Language Models (LLM) zur Sprachtranskription eingesetzt, wobei verwaltungsspezifische Podcasts und Lehrvideos - im Vergleich zur Transkription standardsprachlicher Referenzaufnahmen - höhere Wortfehlerraten (WER)
aufweisen. Nachtrainierte LL-Modelle oder zusätzliche Wissensquellen erlauben eine
domänenspezifische Anpassung, u. a. durch Retrieval-Augmented Generation (RAG).
Unsere Transkriptionsexperimente zeigen das Potenzial verwaltungsspezifischer Trainingsdaten, Systemkonfigurationen und Evaluationen. Der VERA-Ansatz ist dabei auf
einfach implementierbare, kosteneffiziente Open Source-Komponenten für kleinere,
z. B. kommunale Behörden ausgerichtet und unterstützt den Schutz sensibler Daten. },
isbn = {978-3-95908-803-9},
issn = {0940-6832},
keywords = {Poster},
url = {https://www.essv.de/pdf/2025_281_288.pdf},
}