Experimente zur Transkription von Verwaltungsbesprechungen und domänenangepasste Ergebnisprotokollierung

Abstract:

Für eine sachgerechte Dokumentation des Verwaltungshandelns und rechtssichere Verwaltungsentscheidungen sind bei jeder Besprechung die wichtigsten Ergebnisse zu erfassen. Die Dokumentation erfolgt verwaltungstypisch durch manuell erstellte, schriftliche Ergebnisprotokolle, deren Erstellung zeitintensiv ist. Fachlich involvierte Mitarbeitende sind oft selbst am Gespräch beteiligt und stehen nur bedingt für die Protokollierung zur Verfügung. Eine Beteiligung weiterer Sachverständiger ist häufig unwirtschaftlich. Methoden der künstlichen Intelligenz (KI) erleichtern eine Optimierung und Automatisierung von Geschäftsprozessen in der öffentlichen Verwaltung. Im Forschungsprojekt „Verwaltungs-ERgebnisprotokoll Assistenz“ (VERA) werden vortrainierte Large Language Models (LLM) zur Sprachtranskription eingesetzt, wobei verwaltungsspezifische Podcasts und Lehrvideos - im Vergleich zur Transkription standardsprachlicher Referenzaufnahmen - höhere Wortfehlerraten (WER) aufweisen. Nachtrainierte LL-Modelle oder zusätzliche Wissensquellen erlauben eine domänenspezifische Anpassung, u. a. durch Retrieval-Augmented Generation (RAG). Unsere Transkriptionsexperimente zeigen das Potenzial verwaltungsspezifischer Trainingsdaten, Systemkonfigurationen und Evaluationen. Der VERA-Ansatz ist dabei auf einfach implementierbare, kosteneffiziente Open Source-Komponenten für kleinere, z. B. kommunale Behörden ausgerichtet und unterstützt den Schutz sensibler Daten.


Year: 2025
In session: Poster
Pages: 281 to 288