@InProceedings{Hoppe2026_1277,
author = {Sophie Hoppe and Anabell Hacker and Markus Brückl},
booktitle = {Studientexte zur Sprachkommunikation: Elektronische Sprachsignalverarbeitung 2026, Tagungsband der 37. Konferenz},
title = {Im Raum der Täuschung - Raumhall als Schwachstelle automatischer Deepfake-Erkennung},
year = {2026},
editor = {Günther Wirsching},
month = mar,
pages = {47--57},
publisher = {TUDpress, Dresden},
abstract = {In dieser Studie wird die Robustheit eines frei zugänglichen Detektionssystems zur Erkennung von Audio-Deepfakes (DEEPFAKE TOTAL) getestet. Die verwendeten Äußerungen stammen aus der BRANDDB, in der sieben Schauspieler die fünf Markenpersönlichkeitsdimensionen ausschließlich durch Stimme und Sprechweise darstellen. Durch die Verwendung eines Voice-Cloning-Tools, sowie eines Voice-Conversion-Tools von ELEVENLABS, werden Audio-Deepfakes erzeugt, welche die Stimme und Sprechweise der Originaläußerungen synthetisieren. Sowohl die Originale als auch die Audio-Deepfakes werden zusätzlich in einem Büroraum erneut aufgenommen, um natürlichen Raumhall zu erzeugen. Die Ergebnisse zeigen, dass durch Raumhall maskierte Audio-Deepfakes von DFT nicht mehr signifikant von Originalaudios unterschieden und teilweise sogar als natürlicher bewertet werden. Darüber hinaus weisen die Befunde auf genderspe- zifische Verzerrungen und den Einfluss der unterschiedlichen Sprechweise der Markenpersönlichkeitsdimensionen auf die Klassifikationsleistung hin. Alle Audiodateien und Ergebnisse sind unter https://www.tu.berlin/kw/forschung/projekte abzurufen.},
isbn = {978-3-95908-834-3},
issn = {0940-6832},
keywords = {Speech Signal Recognition and Enhancement},
url = {https://www.essv.de/pdf/2026_47_57.pdf},
}