@InProceedings{Bitterlich2025_1263,
author = {Robin Bitterlich and Oliver Jokisch and Ullrich Prax and Rocco Zimmermann},
booktitle = {Studientexte zur Sprachkommunikation: Elektronische Sprachsignalverarbeitung 2025},
title = {Experimente zur Transkription von Verwaltungsbesprechungen und domänenangepasste Ergebnisprotokollierung},
year = {2025},
editor = {Sven Grawunder},
month = mar,
pages = {281--288},
publisher = {TUDpress, Dresden},
abstract = {Für eine sachgerechte Dokumentation des Verwaltungshandelns und rechtssichere Verwaltungsentscheidungen sind bei jeder Besprechung die wichtigsten Ergebnisse zu erfassen. Die Dokumentation erfolgt verwaltungstypisch durch manuell erstellte, schriftliche Ergebnisprotokolle, deren Erstellung zeitintensiv ist. Fachlich involvierte Mitarbeitende sind oft selbst am Gespräch beteiligt und stehen nur bedingt für die Protokollierung zur Verfügung. Eine Beteiligung weiterer Sachverständiger ist häufig unwirtschaftlich. Methoden der künstlichen Intelligenz (KI) erleichtern eine Optimierung und Automatisierung von Geschäftsprozessen in der öffentlichen Verwaltung. Im Forschungsprojekt „Verwaltungs-ERgebnisprotokoll Assistenz“ (VERA) werden vortrainierte Large Language Models (LLM) zur Sprachtranskription eingesetzt, wobei verwaltungsspezifische Podcasts und Lehrvideos - im Vergleich zur Transkription standardsprachlicher Referenzaufnahmen - höhere Wortfehlerraten (WER) aufweisen. Nachtrainierte LL-Modelle oder zusätzliche Wissensquellen erlauben eine domänenspezifische Anpassung, u. a. durch Retrieval-Augmented Generation (RAG). Unsere Transkriptionsexperimente zeigen das Potenzial verwaltungsspezifischer Trainingsdaten, Systemkonfigurationen und Evaluationen. Der VERA-Ansatz ist dabei auf einfach implementierbare, kosteneffiziente Open Source-Komponenten für kleinere, z. B. kommunale Behörden ausgerichtet und unterstützt den Schutz sensibler Daten. },
isbn = {978-3-95908-803-9},
issn = {0940-6832},
keywords = {Poster},
url = {https://www.essv.de/pdf/2025_281_288.pdf},
}