Programm

Im Folgenden finden Sie das vorläufige Programm der ESSV 2021.

3. März

Von	Bis	Programmpunkt
8:45	9:00	Eintritt
9:00	9:30	Eröffnung und Begrüßung
9:30	10:30	Keynote 1: Hans Uszkoreit
10:30	12:00	Session 1: Paralinguistik Ingo Siegert, Oliver Niebuhr OVGU Magdeburg Speech Signal Compression Deteriorates Acoustic Cues to Perceived Speaker Charisma Anabell Hacker TU Berlin ‚Alexa, who are you?‘ – Analysing Alexa's, Cortana's and Siri's Vocal Personality Siddarth Venkateswaran, Thomas Keßler, Ronald Böck, Ossmane Krini OVGU Magdeburg Pseudo-Labelling and Transfer Learning Based Speech Emotion Recognition Lara-Sophie Christmann TU Berlin Emotion Bias in Automatic Speech Recognition
12:00	13:30	*Mittagspause*
13:30	14:30	Postersession 1 Felix Burkhardt, Markus Brückl, Björn W. Schuller TU Berlin Age classification: Comparison of Human and Machine Performance Using Different Utterance Types Ivan Kraljevski, Marek Rjelka, Frank Duckhorn, Constanze Tschöpe, Matthias Wolff BTU Cottbus-Senftenberg Cross-Lingual Acoustic Modeling in Upper Sorbian - Preliminary Study Janina Reuter, Merikan Koyun, Christoph Daniel Schulze, Reinhard von Hanxleden CAU Kiel Real-Time Implementation, Comparison, and Combination of pitch tracking Algorithms Jürgen Trouvain, Raphael Werner Universität des Saarlandes Human pause detection in spontaneous speech in an online experiment Werner Meyer, Borislav Borislavov, Friedrich Eckert, Christian Richter, Ronald Römer, Peter beim Graben, Markus Huber, Matthias Wolff BTU Cottbus-Senftenberg Formalisierung und Implementierung einer adaptiven kognitiven Architektur unter Verwendung von Strukturdiagrammen Oliver Jokisch, Tilo Strutz, Alexander Leipnitz, Ingo Siegert, Andrey Ronzhin HfT Leipzig Audio and Video Processing of UAV-Based Signals in the Harmonic Project Mino Lee Sasse, Stefan Schaffer, Aaron Ruß DFKI Berlin Automatic-Subtitling, Comparison on the Performance of Forced Alignment and Automatic Speech Recognition Sebastian Barth, Simon Stone, Peter Birkholz TU Dresden Artificial Bandwidth Extension using a Glottal Excitation Model
14:30	14:45	*Kaffeepause*
14:45	16:15	Session 2: ASR Wentao Yu, Steffen Zeiler, Dorothea Kolossa Ruhr-Universität Bochum Towards reliability-guided information integration in audio-visual speech recognition Pouriya Amini Digehsara, Christoph Wagner, Petr Schaffer, Michael Bärhold , Simon Stone, Dirk Plettemeier, Peter Birkholz TU Dresden On the optimal set of features and robustness of classifiers in radar-based silent phoneme recognition Fahrettin Gökgöz, Mahmoud Hashem Fraunhofer FKIE Investigating the scarce data and resources problem for speech recognition using transfer learning and data augmentation Benjamin Milde, Robert Geislinger, Irina Lindt, Timo Baumann Universität Hamburg Open source automatic lecture subtitling
17:00	19:00	Welcome Reception in gather.town Podiumsdiskussion und Fragerunde "Nachwuchs in der Sprachtechnologie aus Sicht der Wirtschaft" Eingeladene Gäste: Prof. Felix Burkhardt (TU Berlin, audEERING GmbH) Rico Petrick (Linguwerk GmbH) Daniel Willett (Amazon) Okko Buss (Car.SW Org)
19:00		Sitzung des Fördervereins

4. März

Von	Bis	Programmpunkt
8:45	9:00	Eintritt
9:00	10:00	Keynote 2: Elisabeth André
10:00	12:00	Session 3: Phonetik/Artikulation Harald Höge Universität der Bundeswehr München Cortical Segmentation of Syllables Paul Konstantin Krug, Simon Stone, Alexander Wilbrandt, Peter Birkholz TU Dreden TargetOptimizer 2.0: Enhanced Estimation of Articulatory Targets B. Andreeva, G. Demenko, J. Bachan, I. Gessinger, K. Jankowska, B. Möbius Universität des Saarlandes Phonetic convergence evaluation based on fundamental frequency variability Peter Steiner, Ian S. Howard, Peter Birkholz TU Dresden Glottal Closure Instant Detection using Echo State Networks Ian S. Howard, Julian McGlashan & Adrian J. Fourcin University of Plymouth Machine Learning analysis of speech and EGG for the diagnosis of voice pathology Paul Schmidt-Barbo, Elnaz Shafaei-Bajestan, Konstantin Sering Eberhard Karls Universität Tübingen Predictive articulatory speech synthesis with semantic discrimination
12:00	13:30	Mittagspause
13:30	14:30	Postersession 2 Omnia Ibrahim, Ivan Yuen, Marjolein van Os, Bistra Andreeva, Bernd Möbius Universität des Saarlandes The effect of Lombard speech modifications in different information density contexts Benjamin Weiss, Stefan Hillmann, Sebastian Möller TU Berlin Intents in Sprachdialogen: Eine Praxisperspektive Thomas Ranzenberger, Christian Hacker Elektrobit Automotive GmbH, Erlangen VADiMoS: A Web Tool For Designing Voice Assistant Independent and Ontology based Dialogs Konstantin Sering, Motoki Saito, Fabian Tomaschek Eberhard Karls Universität Tübingen Anticipatory coarticulation in predictive articulatory speech modeling Alexandra Ebel, Johannes Förster, Mathias Walther Martin-Luther-Universität Halle-Wittenberg Developing the German Pronunciation Database (DAD) - an online dictionary for spoken German Marco Braune TU Berlin Untersuchung von Qualitätsunterschieden zwischen gesprochener und geschriebener Sprache bei Interaktion mit einem Chatbot Daniel Duran, Sarah Warchhold Albert-Ludwigs-Universität Freiburg Der Faktor Mensch in der Mensch-Maschine-Interaktion
14:30	14:45	*Kaffeepause*
14:45	16:15	Session 4: Sprachdialog Stefan Hillmann, Tilo Himmelsbach, Benjamin Weiss TU Berlin Performanz und Trainingsverhalten von Dialog-Policies bei Reinforcement Learning Md. Mahmud-uz-zaman, Stefan Schaffer, Tatjana Scheffler DFKI Berlin Comparing BERT with an intent based question answering setup for open-ended questions in the museum domain Peter Klimczak, Peter beim Graben, Markus Huber, Günther Wirsching BTU Cottbus A Dynamic Machine Semiotics Approach for a Human-Centered User Interface Jan Nehring, Akhyar Ahmed DFKI Berlin Normalisierungsmethoden für Intent Erkennung Modularer Dialogsysteme

5. März

Von	Bis	Programmpunkt
8:45	9:00	Eintritt
9:00	10:00	Keynote 3: David Schlangen
10:00	11:00	Session 5: Synthese Jacek Kudera, Marjolein van Os, Bernd Möbius Universität des Saarlandes Natural and synthetic speech comprehension in simulated tonal and pulsatile tinnitus: A pilot study Bogdan Ludusan, Petra Wagner Universität Bielefeld Knock-Knock! Who's There? The Laughter-Enhanced Virtual Real-Estate Agent Mikey Elmers, Raphael Werner, Bernd Möbius, Jürgen Trouvain Universität des Saarlandes Evaluating the effect of pauses on number recollection in synthesized speech
11:00	11:30	Kaffeepause
11:30	12:30	Session 6: Sprachsignalverarbeitung / Evaluierung Sebastian Möller, Andreas Bütow TU Berlin Prediction of Background Noise Degradations in Fulland Speech Communication Scenarios Georg Schmidt, Ingo Siegert OVGU Magdeburg Studie zur Lösbarkeit des Problems starker Pegelschwankungen im Home-Entertainment Thilo Michael TU Berlin Intelligibility in Telephone Conversations with Packet Loss
12:30	13:30	Ankündigung ESSV 2022 Ehrung des besten studentischen Beitrags Verabschiedung