ESSV Archive

Home

Add

1262 Results for given search request:

"" in Authors

1990

Programm und Ergebnisse der automatischen Sprachsignalverarbeitung an der TU Dresden

W. Tscheschner

Elektronische Sprachverarbeitung - Stand der Technik, Probleme, Zukunftsperspektiven

K. Fellbaum

Zur Qualifizierung des technischen Hintergrundes der automatischen Sprachsignalverarbeitung

Rüdiger Hoffmann

Ein Experimentiersystem zur Sprachsignalanalyse und -erkennung

Steffen Kürbis, V. Paul

Verfahren der elektronischen Sprachsignalverarbeitung für die Experimentalphonetik

Manfred Krause

Die Beurteilung der Leistungsfähigkeit von Spracherkennungssystemen

Helmut Mangold

Zu Ergebnissen der Intonationsforschung an der Humboldt-Universität zu Berlin

Dieter Mehnert

Der Nutzwert prosodischer Merkmale für die automatische Spracherkennung

E. Paulus, H. -D. Gerken, J. Reinecke, J. Veidt

Die Schnittstelle zwischen Sprachsignalverarbeitung und symbolischer Sprachverarbeitung

Gudrun Flach

Arbeiten zur Sprachsynthese an der TU Dresden

Ulrich Kordon, Heiko Petzold, Antje Wirth

Automatische Erkennung kontinuierlicher Sprache im Rahmen des Forschungsprojektes SPICOS

Hermann Ney

Arraytechniken zur Geräuschreduktion bei Sprachübertragung

Kristian Kroschel

Einzelworterkennung in störgeräuscherfüllter Umgebung

Dieter Becker

Simulation Neuronaler Netze zur Spracherkennung auf einer Multi-Transputer-Hardware

Dietmar Neumerkel

Sprachcodierung im digitalen Mobilfunk

H. -J. Braun

Die Erkennung von Hüllkurvenveränderungen als Systemkomponente zur Datenreduktion von Audiosignalen

Friedrich E. Blutner

Sprachsignalauswertung mit dem Expertsystem EXA 1630

Detlev Langmann

Perzeptive Untersuchungen zur Zeitstruktur von /g/-Lauten

Jörg Helbig

Sprachsynthese-Anwendungen

Ulrich Kordon

Das natürlichsprachliche Interface NLI-AIDOS

H. Helbig, F. Zänker

Text-Phonem Transformation für die deutsche Sprache mittels Neuronaler Netze

I. Santibánez-Koref, H. M. Voigt, T. Förster, C. Wolke, R. Gehne, A. Schütte, M. Fabiunke

Zur Prägnanz initialer Mikrointonation in Aussagesequenzen deutscher Sprecher

Christian Gutowski

Sprachdialogterminal als Prozeß-Schnittstelle in komplexen Steuerungssystemen

Torsten Rudolph

Anwendungsaspekte für die Integration der Spracheingabe in ein technologisches Expertensystem

Rudolf Meyer, Sylvia Mieth

Fallbeispiele der Spracheingabe

H. Mutschler

Mensch-Maschine Dialoge in natürlicher Sprache

L. Hitzenberger, H. Kritzenberger

Anwendung der rechnergestützten Sprachanalyse in der Lautanalyse bei Nutztieren

Ralf-Bernd Laube, Gunther Marx, Volker Paul

Phonetische Arbeitsstationen: Hardware und Software zur experimentellen Sprachsignalverarbeitung

Michel T. M. Scheffers, Werner Thon

Experimente zur Vektorquantisierung auf Fuzzy-Basis

Lutz Friedemann

FD-Spectrums and Their Simulation by Neural Networks

M. Reuter, R. H. Kluwe

"Rapid Prototyping" von Sprachsystemen

Joachim Zinke

Einsatz eines "Backpropagation"-Netzwerks für die sprecherunabhängige Spracherkennung von Einzelwörtern

M. Zhu, Klaus Fellbaum

Ein sprecheradaptiver Hidden-Markov-Erkenner für große Wortschätze

Karl Trottler, Fritz Class, Peter Regel

Elektronische Kommunikationshilfen mit Sprachein- und Sprachausgabe für motorisch behinderte Benutzer

Harald Klaus, Klaus Fellbaum

Das System zur elektrischen Hautreizung SEHR-3

Hans Georg Piroth, Hans G. Tillmann

Eine Computer-Lernhilfe für das Lippenlesen

Hans -H. Bothe, Dietrich Naunin

Echtzeitimplementierung eines CELP-Codecs mit ungleichgewichtigem Fehlerschutz

Kai Clüver, Thomas Gries, Hui Li

1991

Arbeiten zur Sprachcodierung und Sprachverarbeitunagm Berliner Institut für Fernmeldetechnik

Klaus Fellbaum, Peter Noll

Zu Forschungsansätzen auf dem Gebiet der technischen Sprachkommunikation

Walter Tscheschner, Rüdiger Hoffmann

Zur Veränderung akustischer Merkmale bei Akzentverlust

Dieter Mehnert

Die slowakische Sprache als Objekt der automatischen Analyse und Synthese

Á. Král, Sachia Darzagin

Verfahren zur Sprachqualitätsbeurteilung bei der elektronischen Sprachsignalverarbeitung

J. Sotscheck

Verständlichkeit der künstlichen Sprache bei Schwerhörigen

A. Fuhr-Horst, P. Plath

Klassifikation von Explosivlauten mit konsonantischem Kontext

J. Helbig

Irregularitäten im Sprachsignal - störend oder informativ?

A. Kießrling, R. Kompe, E. Nöth, A. Batliner

Über akustische Prägung beim Menschen

F. Blutner

Spracherkennung mit prädiktiven neuronalen Netzwerken

Herbert Reininger, Klaus Kasper

Kodierung linguistischen Wissens in ANNs und Kopplung an die akustische Spracherkennung

R. Deffner, H. Geiger

Psychoakustisch motivierte Vorsegmentierung fließender Sprache

D. Langmann, J. Krämer

Automatische Extraktion von Sprachmodellen für Hidden-Markov-Modelle aus einem semantischen Netzwerk

Gerhard Sagerer, Franz Kummert, G. Fink, B. Seestaedt

Automatische Erkennung fließender deutscher Sprache mit silbenorientierten Einheiten

G. Ruske, B. Plannerer

Regelbasierte Erzeugung von robusten Aussprachemodellen und deren Darstellung im Silbenraster

Florian Schiel, F. Wolfertstetter

Simulation eines Einzelworterkenners mit integrierter ein-, zwei- und vierkanaliger Störreduktion

Dieter Becker

Aspekte der textabhängigen Sprecherverifikation

L. Fliegner, Klaus Fellbaum

CELP-Verfahren mit adaptivem Anregungscodebuch

U. Kipper, Herbert Reininger, D. Wolf

Sprachverstehen im Bürobereich - Ein integriertes Konzept für den rechnergestützten Arbeitsplatz

Ruth Marzi

Einbindung von Spracherkennung in Anwendungen der Telekommunikation

J. Zinke, Stephan Euler

Sprachsynthese im Zeitbereich

Ulrich Kordon, Heiko Petzold

Blindenarbeitsplatz mit Sprachausgabe TABION

H. Brümmer

Sprachanalyse-System für PC und Workstation

A. Kohl

Transformationscodierung von Sprachsignalen bei geringen Übertragungsraten

M. Arndt

Die Nutzung des Signalprozessors TMS320C25 für die Echtzeitrealisierung von Transformationscodern

M. Arndt

Untersuchungen zum merkmalsbasierten Wörterbuchzugriff

Gudrun Flach , P. Zillmer

Unscharfe lokale Bewertungsalgorithmen für DTW-Erkenner

L. Friedemann, T. Rudolph

Phonetische Detailliertheit und Sprechermerkmale

Reinhold Greisbach, O. Esser, C. Weinstock

Prosodische Merkmale gesprochener Sprache: Generierung und Synthese

Carsten Günther

Anwendungen der Spracherkennung für motorisch behinderte Benutzer

Harald Klaus, Klaus Fellbaum

Optimierung der Sprachübertragungsqualität durch den Fernsprechteilnehmer

W. Krebber

Rechnergestützte Analyse zur Lautontogenese beim Schwein - einige biologische Determinanten, Umwelteinflüsse

R. -B. Laube, C. Igney, J. Helbig, G. Marx

1992

Professor Walter Tscheschner - Promotor der Sprachsignalverarbeitung (laudatio)

Susanne Fuchs

Sprachsynthese - ein gelöstes Problem?

Wolfgang Hess

Verfahren der Sprachübertragung und Sprachverarbeitung für gegenwärtige und zukünftige Telekommunikationsdienste

Klaus Fellbaum

Visualisierung von Sprachsignalparametern - Ergebnisse der phonetischen und sprachakustischen Forschung für die Rehabilitation Hör- und Sprachbehinderter

Dieter Mehnert

Phonembasierte Spracherkennung mit topologischen Merkmalskarten

Herbert Reininger, A. Leue

The enhancement of noisy speech for transmission and recognition

J. Uhlir, P. Sovka

Ereignisgesteuerte Spektralanalyse zur Beschreibung sehr kurzer Sprachsignalabschnitte

J. Helbig

Entropie-Profile und Epogramme von Sprachsignalen

C. Bandt, B. Pompe

Einfluß einer adaptiven Nachfilterung auf die Sprachqualität eines 2,4 kb/s ACELP-Coders

U. Kipper, Herbert Reininger, D. Wolf

Sprachcodierung bei 800 bit/s unter Verwendung eines Matrixprodukt-Segmentvocoders

S. Bruhn

Zur kritischen Periode der akustischen Prägung

Friedrich E. Blutner, C. Haller, S. Haller

Untersuchungen zur Lautdiskriminierbarkeit visualisierter Sprache

K. Hobohm, Manfred Krause

Sprachproben für Sprachqualitätsmessungen und deren phonologische Eigenschaften

J. Sotscheck

Zur Klassifikation und Beurteilung von Sprachsyntheseverfahren

C. Jürgens

Sprachsynthesemodul auf Zeitfunktionsbasis

L. Friedemann, Ulrich Kordon

Synthese der tschechischen Sprache

Robert Vích, E. Vichova, M. Ptácek

Wissensbasierte Silbenerkennung aus dem Satzverbund Ergebnisse nach einem Jahr Beteiligung am ASL-Projekt

Gudrun Flach , Rüdiger Hoffmann, J. Krämer, Steffen Kürbis, C. M. Westendorf

Das prosodische System des Deutschen aus Sicht der Sprachproduktion

Carsten Günther

Digitale Filterbank für die Sprachverarbeitung

B. Kriener, J. Reber, H. Voges

14-Bit-Sprachausgabeeinheziutm Anschluß an eine PC- Druckerschnittstelle

M. Lehning

Sprachdaten-Management mit Dnorm 3.0

T. Rudolph

Eigenschaften eines statistischen Modells auf Wortebene für die deutsche Sprache

U. Bandara, G. Möse, G. Walch

1993

European research cooperation in the speech area

J. Ekberg

Sprachsignalverarbeitung im Dienst behinderter und alter Menschen. Ein Überblick über Anwendungsmöglichkeiten

W. Zagler

Einsatz der elektronischen Sprachverarbeitung im Bereich der Medizintechnik

Helmut Mangold

Phonetische und sprachakustische Forschungen an der Humboldt-Universität zu Berlin unter Berücksichtigung der Anwendung in der Rehabilitation

Dieter Mehnert, G. Lindner

Einsatz der elektronischen Sprachverarbeitung im Behindertenbereich - Ausgewählte Beispiele

Klaus Fellbaum

Sprachtechnologie zwischen Theorie und Anwendung

Rüdiger Hoffmann

Computerunterstützte klinische und experimentelle Untersuchung zentraler Sprechstörungen

T. Ahrndt, Wolfram Ziegler, J. Teiwes

Talking Heads: Audiovisuelles Sprachlabor für den Absehunterricht mit Hörbehinderten

H. H. Bothe, D. Naunin, K. Wittien

Dreidimensionale Darstellung von Sprache und anderer akustischer Information für einen Blinden-Computer-Arbeitsplatz

K. Chrispien, Klaus Fellbaum

Phoneme-oriented approach to speech recognition in Slovak

Sachia Darzagin, Á. Král, Milan Rusko

Signalverarbeitung zur Verbesserung des Sprachverstehens mit Cochlea-Implantaten

Wolfgang H. Döring, A. Falter, H. G. Hirsch

Struktur eines Sprecherverifizierungssystems und sein möglicher Einsatz im Behindertenbereich

L. Fliegner, Klaus Fellbaum

Das TASO-Prinzip: Vollsynthetische Sprachausgabe plus Hardware hilft bei der Integration Sehgeschädigter in Beruf, Ausbildung und Freizeit

J. Frank

Sprachsynthese mit Hilfe neuronaler Netze

C. Herrmann

Linguistische Verlaufsdiagnostik bei der Anwendung elektronischer Signalverarbeitung in der Rehabilitation

W. Herrmann

Einsatz des Sprachprozessors VOICE in portablen Blindenhilfsmiteln

Diane Hirschfeld, Ulrich Kordon, W. -J. Fischer

Realzeitvisualisierung gesprochener Sprache für die Gehörlosensprechschulung mit einem Standard-PC

K. Hobohm

Zum Einsatz des HUB-Computer-Hörtrainers bei der Rehabilitation nach Eochlear-Implantation

H. Ilchmann, B. Lommatzsch, Dieter Mehnert

Sprachsynthese auf Clusterbasis nach dem PSOLA-Verfahren

C. Jürgens, Klaus Fellbaum

Prototyp eines sprachgesteuerten Notrufgerätes für motorisch Schwerbehinderte

Harald Klaus

Ein spezieller Kopfhörer mit realitätsnaher Vorneortung von Hörereignissen

F. König

Audio-taktiler Dialog über Graphiken und Diagrammen insbesondere für Blinde und Sehbehinderte

J. Lötzsch

Sprachsteuerung eines entscheidungsunterstützenden Systems

Ruth Marzi, S. Prinz

Zur elektromagnetischen Artikulographie der Konsonantenartikulation

B. Pompino-Marschal

Dialogorientierte Erfassung und Kodierung der frühen Kindersprache (DEKKS)

B. Reimann, Dieter Mehnert

Erfahrungen mit dem Einsatz von Spracherkennern mit großem Wortschatz in der Rehabilitationstechnik

P. Rohleder, M. Zhu

Robuste Worterkennung mit geringem Trainingsaufwand

T. Rudolph

Sprachdialogsysteme im ISDN

T. Schürer

Sprachausgabe in Kommunikatoren für nichtsprechende Personen

L. Seveke

Zu einigen psycholinguistischen Phänomenen bei der Editierung von Sprachsynthetisatoren

Walter Tscheschner

Sprachsynthetisator für die tschechische Sprache

Robert Vích, J. Pribil, E. Víchová

Eine auditive Oberfläche für ein behindertengerechtes Komforttelefon

Antje Wirth

1994

Sprachverarbeitung - eine Schlüsseltechnologie für die Telekommunikation

B. Lochschmidt

Applications of Automatic Speech Recognition in Dictation, Information Retrieval and Device Control

V. Steinbiß

Sprachverarbeitung für Telefonanwendungen

Harald Höge

New Audio Coding Standards

Peter Noll

Multilinguales Sprachdialogsystem für den Cityruf-Service

C. Müller

BABSY - Ein Sprachdialogsystem für Telefonanwendungen

B. Kaspar, Karlheinz Schuhmacher, Georg Fries, A. Wirth

Algorithmen zur Sprecheradaption für telefonbasierte Sprachdialogsysteme

S. Dobler

Untersuchungen zur Gestaltung eines Sprachdialogsystems im Telefonnetz

T. Schürer

Experimentelle Untersuchungen der menschlichen Einflußfaktoren bei automatischen Dialog-Systemen

O. Hartmann, K. Zünkler

Ein systematischer Vergleich von diskreten, kontinuierlichen und hybriden HMM-basierten Systemen zur Spracherkennung

C. Neukirchen, Gerhard Rigoll

Neuartiger hybrider SKHMM/KNN-Ansatz für die Spracherkennung

H. -P. Hutter, B. Pfister

Phonetische Grobklassifikation mit zeitverzögerten Neuronalen Netzen

W. Reichl, G. Ruske

Satzerkennung mit modifizierten Wahrscheinlichkeitsverläufen

T. Rudolph

Beschreibung von Aussprachevarianten

G. Flach

Veränderung spektraler Merkmale bei Akzentuierungswechsel

Dieter Mehnert

Zur Robustheit stochastischer und neuronaler Spracherkennungssysteme

Klaus Kasper, N. Nicol, Herbert Reininger, D. Wolf

Auswirkungen der phonetischen Zusammensetzung des Sprachmaterials auf die Erkennungsrate bei Sprecherverifizierungssystemen

L. Fliegner, B. Klusmann

Optimierung eines Spracherkenners für Telefonsprache

T. Schürer

Ausdruck von Stimme und Sprechweise nach Felix Trojan

W. A. Deutsch, Sylvia Moosmüller, R. Vollmann

Probleme der Verschriftung und Kodierung der frühen Kindersprache

B. Reimann, Dieter Mehnert

Bandbegrenzte Funktionen als Hilfsmittel zur Fehlerkorrektur von Grundfrequenzverläufen

M. Lehning

ARCOS-G, ein Experimentalsystem zur Erkennung kontinuierlicher deutscher Sprache

S. Safra, B. Pfister

Automatische Spracherkennung für einen Trainingssimulator

T. Lange, A. Paeseler, H. -H. Hamer, H. Bergmann

Die Behandlung von Wortkomposita in der maschinellen Spracherkennung

M. Spies

Zur akustischen Realisierung des Wortakzents

B. Heuft, T. Portele

Zum Einfluß der Abtastfrequenz auf die Qualität synthetischer Sprache

T. Portele

Ein System zur Modifikation prosodischer Eigenschaften fließend gesprochener Sprache

J. Reinecke

Sprachein- und -ausgabetechnik: Anwenderforderungen und technische Realisierbarkeit

Rüdiger Hoffmann, Ulrich Kordon

Eigenschaften von Spracherkennungssystemen in praktischen Anwendungen

A. Noll, H. Bergmann, H. -H. Hamer, A. Paeseler, H. Tomaschewski

Kundendialog in der Anlagenberatung mit Sprachunterstützung

Ruth Marzi, K. Richter

Building Voice-Activated Applications Under MS-Windows

M. Zhu, P. Rohleder

Überlegungen zum Einsatz der Chipkarte in der Sprachsignalverarbeitung

B. Kriener, Klaus Fellbaum, L. Fliegner, R. Marzbanvishka

Zur Beurteilung von Spracherkennungssystemen unter Wirtschaftlichkeitsbedingungen: Beschreibung einiger konkreter Anwendungsfälle

C. Prenzel

Fuzzy Head: Ein mechanisches Kopfmodell zur Nachbildung sichtbarer Sprechbewegungen

H. -H. Bothe

Zweidimensionale Phonemkarte des Deutschen auf der Basis visueller Lippenmerkmale

H. -H. Bothe, E. -A. Wieden

Prinzip und Einsatzmöglichkeiten eines Artikulographen

A. Zierdt

Einfluß typischer Raumänderungen auf das Übertragungsverhalten

J. Marx

Bedeutung der binauralen Signalverarbeitung zur Sprachverständlichkeit in störschallerfüllter Umpebung

K. Genuit

Verfahren zur räumlichen Darstellung synthetisierter Sprache

K. Crispien, Klaus Fellbaum, W. Würz

CELP mit phonetisch orientierter Anregung

U. Balss, Herbert Reininger, D. Wolf

Ein Sprachcodec für den asynchronen Transfermodus

K. Clüver, L. Schröder

Effiziente Interblock-Codierung der Kurzzeit-Spektralinformation in der sehr niederratigen Sprachübertragung

S. Bruhn

Anwendung der impliziten homomorphen Entfaltung für die LPC-Analyse

Robert Vích

Mehrkanal-Sprachpausendetektoren für Laufzeitsteuerungen

M. Drews

Methoden zur robusten Sprachdecodierung bei Mobilfunkkanälen basierend auf den statistischen Eigenschaften der Sprachparameter

Stefan Feldes

Ein flexibles Programmpaket zur Visualisierung von Sprachdaten

M. Reyelt

DANA - Ein Programmsystem zur statistischen Modellbildung über Sprachsignalbeschreibungen

C. -M. Westendorf

Conception of System for Speech Signal Analysis by Linear Prediction

Sachia Darzagin, Marian Trnka, Milan Rusko

Signal-zu-Rauschabstände beim freisprechend Telefonieren im Kraftfahrzeug

T. Haulick

Psychoakustisch motivierte Einzelmaße als Ansatz zur objektiven Qualitätsbestimmung von ausgewählten Sprachcodiersystemen

Jens Berger, A. Merkel

Abhängigkeit der zeitlichen Positionierung charakteristischer Mundbilder von übergeordneten Einflußfaktoren

F. Rieger, H. -H. Bothe, G. Lindner

Sprachverarbeitung in einem hierarchischen neuronalen Netzwerk

H. Behme, W. D. Brandt, H. W. Strube

Akustische Steuerung beliebiger graphikorientierter Anwendungen mittels Verbundworterkennung

Ruth Marzi, M. Pötter, Harald Klaus

Einsatz der automatischen, natürlichsprachigen Erkennung zur Steuerung von Leitwarten

B. Bitzer, R. Dömer

Objektorientierte Implementierung eines Spracherkennungssystems mit integrierter Suche

B. Plannerer

Vergleichende Beurteilung von verschiedenen Analyseparametern für die Einzelwort-Spracherkennung

O. Sahm, T. Schürer

TUBSY: Sprachsynthese auf Clusterbasis nach dem PSOLA-Verfahren

C. Jürgens

Vergleich von Transkriptionsansätzen für deutsche Namen

A. Mengel, K. Rosenke

Einsatz von neuronalen Netzen zur Transkription von orthographischem Text in Lauischrift

K. Rosenke

Labeled-Graph-Matching zur Einzelworterkennung

N. Kunstmann, P. Tavan

1995

Zur Reflektion phonetischer Kategorien durch One-state-Modelle

Walter Tscheschner

Korrelation von Sprachsignalen im Zeit- und Frequenzbereich

Robert Vích, Petr Horák, M. Schwarzenberg

Sprachpausendetektion zur Realisierung von Spektralsubtraktionsverfahren

V. Davidek, P. Sovka, J. Šika

Objektive Parameter zur Charakterisierung der Stimmqualität in emotional gehaltvoller Sprache

G. Klasmeyer, Walter F. Sendlmeier

Referenzsysteme für die auditive Qualitätsbeurteilung von synthetisch erzeugter Sprache

Harald Klaus

Anwendbarkeit eines psychoakustisch motivierten Sprachvorverarbeitungsmodells für die Sprachqualitätsmodellierung

M. Hansen, B. Kollmeier

Lokal rekurrente neuronale Netzwerke zur effizienten Realisierung eines Spracherkennungssystems

Klaus Kasper, Herbert Reininger, D. Wolf, H. Wüst

Zur Schlüsselworterkennung in fließender Sprache unter Verwendung neuronaler Netze

I. Suhardi, Klaus Fellbaum

Sprecherunabhängige Erkennung fließend gesprochener Sprache mit informationstheoretischen neuronalen Netzen und Hidden-Markov-Modellen

C. Neukirchen, J. Rottland, Gerhard Rigoll

Evaluierung von signalnahen Spracherkennungssystemen für deutsche Spontansprache

M. Lehning

Dekorrelation und Reduktion des Merkmalssatzes in Worterkennem

T. Rudolph

Sprecherunabhängige Erkennung verbunden gesprochener Ziffernketten unter Verwendung der Telefon-Sprachdatenbank TUBTEL

T. Schürer

Erkennung fließender Sprache auf der Basis diskreter Hypothesen - eine Alternative zu HMM?

C. -M. Westendorf

Symbolverarbeitung im Sprachsynthesesystem HADIFIX

T. Portele, J. Krämer, D. Stock

Generierung von Grundfrequenzverläufen in einem Sprachsynthesesystem mit neuronalen Netzen

Oliver Jokisch, Ulrich Kordon

Chinesische Sprachsynthese nach dem Prinzip der Verkettung von Zeitfunktionssegmenten

Hongwei Ding, J. Helbig

Untersuchungen zur Auswahl von Sprechern für die Sprachsynthese im Zeitbereich

C. Jürgens, B. Wehen, W. Johannsen

Robuste Vektorquantisierung zur Sprachcodierung bei gestörten Übertragungskanälen

U. Balss, Herbert Reininger, H. Schalk, D. Wolf

Einsatz der Sprecherverifizierung in Open- und Closed-line-Systemen

L. Fliegner, D. Hardt

An automatic information system operating on the voice dialogue base

J. Nouza

Die Eignung unterschiedlicher deutscher Transkriptionssystemarchitekturen für zukünftige Anforderungen

A. Mengel, K. Rosenke

Verschiedene neuronale Strukturen für die Transkription von deutschen Wörten

K. Rosenke

Ein System prosodischer Etiketten zur Transkription von Spontansprache

M. Reyelt

Abbildung prosodischer Etiketten auf prototypische FO-Verläufe

J. Reinecke

TUBTEL - Eine deutsche Telefon-Sprachdatenbank

T. Schürer, Klaus Fellbaum, S. Ahrling, D. Hardt, Harald Klaus, A. Mengel, O. Sahm, I. Suhardi

Optimale Verkettung von Silbenhypothesen

G. Flach, H. Altendorf

Statistisches Modell zur Worterkennung

Milan Sigmund

Integration natürlicher Mikrointonationskonturen in ein Sprachsynthesesystem auf Zeilfunktionsbasis

J. Helbig, U. Wunderlich

Anwendungsaspekte moderner Sprachcodierungsverfahren im Bereich der Flugsicherung

A. Wachtler

FAUST - Ein Automat erteilt Telefonauskünfte

A. Wirth, Georg Fries, B. Kaspar, Karlheinz Schuhmacher

1996

Die Sprechstimme und ihr biologischer Hintergrund

G. Tembrock

Historische Schallaufnahmen - Das Lautarchiv an der Humboldt-Universität zu Berlin

D. Mehnert

Gehörgerechte Signalvorverarbeitung zur robusten Spracherkennung in Störgeräuschen

J. Tchorz, T. Dau, B. Kollmeier

Akustische Sprachparameter zur Bewertung glottaler Pathologien

H. W. Strube, D. Michaelis, M. Fröhlich

Formantbestimmung zur Spracherkennung mit digitalen Resonatoren

L. Welling, H. Ney

Die perzeptive Wirkung ausgesuchter akustischer Parameter zur Charakterisierung des stimmlichen emotionalen Ausdrucks

G. Klasmeyer, T. Meier, A. Baeger, W. F. Sendlmeier

Experimentelle Sprachverarbeitung mit sigmalab

C. -M. Westendorf

Mikrosegmentsynthese - ökonomische Prinzipien bei der Konkatenation subphonemischer Spracheinheiten im Zeitbereich

R. Benzmüller, W. J. Barry

Variabilität und Stabilität segmentaler Merkmale unter dem Aspekt der konkatenativen Sprachsynthese - Vokale

D. Hirschfeld

Deutsch-Tschechische Sprachsynthese in einem Telefon-Auskunftssystem

J. Helbig, P. Horák

Zur Schlüsselworterkennung unter Verwendung prädiktiver neuronaler Modelle

I. Suhardi

Ein zweistufiges System zur automatischen Sprachen-Identifikation

J. Navrátil, W. Zühlke

Untersuchungen zum Einsatz der Störreduktion in der Sprecherverifizierung

D. Hardt

Einflüsse des Urteilsverhaltens von Versuchspersonen auf die Ergebnisse bei auditiven Sprachqualitätsmessungen

H. Klaus, W. Koch

Auditive Illusionen (MacDonald-McGurk-Effekt) zur Evaluierung einer Computer-Animation von sichtbaren Sprechbewegungen

D. Mehnert, A. Saß, H. H. Bothe

Ein audio-taktiles elektronisches Grafik- und Textbuch für Blinde

J. Lötzsch, G. Rödig

Speech Training and Motivating Tools for Hearing-Impaired People

J. Nouza, D. Hájek

Generation of Prosodic Rules for TTS by Quantitative Analysis of F0 Contours

H. Mixdorff

Evaluierung der automatischen Parametisierung von Grundfrequenzkonturen

B. Heuft, B. Streefkerk, T. Portele

Untersuchungen zur Satzakzentuierung

G. Sonntag

New Prosody Modelling System for Czech Text-to-Speech

P. Horák, J. Tučková, R. Vich

Stilisierung von Intonationsverläufen auf Wortebene

A. Mengel

Sprachstatistische Auswertungen an Prüftexten zur Sprachqualitätsbeurteilung

J. Berger

Text-und Dokumentaufbereitung für die Sprachsynthese

G. Flach

Anwendung von synthetischer Sprachausgabe zur Steigerung der Mobilität von Blinden

J. Frank, W. Frasch, L. Frost

Sprachsynthesehardware für Blindenhilfsmittel

T. Funke, U. Kordon

Visualization of Data and Procedures in Speech Processing Tasks

D. Hájek, J. Nouza

Entwicklung eines interaktiven Moduls zur Ausspracheschulung mit einem phonetischen Experimentiersystem

U. Hollmach, O. Schröder

Lautanalyse zur Bewertung der Belastungslaute von Hühnerküken - Möglichkeiten der Diagnose von Einflüssen auf ihre sozialen Beziehungen

G. Marx

The TELES-Electronic Secretary - An Innovative ISDN Application

H. Mixdorff, K. Rosenke, H. Witt

Dynamische Anpassung der Sprechgeschwindigkeit

T. Portele

Analyse der Fehler verschiedener neuronaler Netzstrukturen zur Transkription deutscher Wörter

K. Rosenke

Ein Cepstrum-Prozessor für Sgmalab

M. Wolff

1997

New Algorithms for Digital Audio

P. Noll

Robustes Sprachverstehen und robuste Dialoge - Zwei entscheidende Elemente für die praktische Anwendung der automatischen Sprachverarbeitung

H. Mangold

Applikationsspezifische Sprachmodelle - Erstellung und Anpassung

A. Paeseler, H. Bergmann, H. -H. Hamer, A. Noll, H. Tomaschewski

Trends und Highlights in der elektronischen Sprachsignalverarbeitung

K. Fellbaum

Bilinguale Sprachverarbeitung zur Dateneingabe mit SpeeData - Ansätze und erste Ergebnisse

U. Ackermann

Untersuchungen zur hybriden HMM/MLP-basierten Schlüsselworterkennung

I. Suhardi, H. -G. Kim

Untersuchungen zur textunabhängigen Sprecherverifizierung mit begrenztem Wortschatz

D. Hardt

Evolutionäre Optimierung schneller Worterkenner für Telefonsprache

T. Rudolph

Ein robustes System zum Freisprechen im Kraftfahrzeug

K. Kroschel, M. Ihle

A quasi-triphone model created by merging context-specific phone models

D. Hájek, J. Nouza

Methoden zur Bestimmung der Sprachübertragungsqualität von Freisprecheinrichtungen

H. Klaus

Sprachqualitätsuntersuchungen in europäischen Fernsprechnetzen

J. Berger, T. Scheerbarth

Modellierung von Konversationen über Freisprecheinrichtungen und die Bestimmung der Sprachqualität mit Listening Only-Tests

A. Dehnel, J. Berger, H. Klaus

Datengetriebenes Training von Aussprache-Wörterbüchern - Methoden und Experimente

C. -M. Westendorf, M. Wolff

Nutzung eines feed-forward-Netzes in der automatischen Lautsegmentierung

K. Stöber

Linguistische Konzepte und ihre Rolle in der inhaltsgesteuerten Sprachsynthese

G. P. Sonntag, T. Portele

Silben- oder Lautdauersteuerung?

H. Meyer, T. Portele

Neuronale Prosodiegenerierung in der Sprachsynthese

O. Jokisch, M. Pescheck

Konkatenative Sprachsynthese mit vollautomatisch generiertem "Triphon-Inventar"

M. Holzapfel

Kodierung von Intonationsverläufen mittels Linearer Prädiktion

J. Mersdorf, A. Rinscheid, M. Brüggen, K. U. Schmidt

Dynamische Bausteinauswahl zur Synthese fließender Sprache

D. Hirschfeld, M. Eichner

Ein offener modularer Simulator für Untersuchungen zur Sprachübertragung über ATM

I. Kliche, R. Kapust, P. Noll

Zu den Grundlagen der Sprachsignalverarbeitung

H. Boche, T. Ferchland, J. Fischer, H. Schreiber

Generierung von Bildunterschriften zur Erklärung von räumlichen Zusammenhängen

K. Hartmann, B. Preim, T. Sommerfeld, T. Strothotte

Halbautomatische Nachsynchronisation von Videofilmen - Anwendungen zur Demonstration des McGurk-MacDonald-Effekts

T. Hetmank, H. -H. Bothe

Cepstrales Sprachsynthesesystem für die tschechische Sprache

R. Vich, J. Přibil, M. Ptáček

Automatische Erzeugung von Trainingsdaten für wortorientierte Spracherkennungssysteme

M. Prätzas, H. Reininger

Einflüsse von Störungen analoger Telefonleitungen auf die Qualität von Voice-over-Data-Verbindungen

M. Grell

Einsatz von A-priori-Wissen über Codecparameter zur Detektion von Übertragungsfehlern am Beispiel des G.728 LD-CELP-Algorithmus

A. Wachtler

Ein quantitatives Konzept des artikulatorischen Aufwandes

B. J. Kröger

Segmentierungs- und Konkatenationsprobleme bei der Erstellung einer Lautelementebibliothek für ein Sprachsynthesesystem

B. Ketzmerick

Zur Integration von gesprochener Sprache, Texten, Grafiken und Videos in eine multimediale Online-Vorlesung

H. -J. Ullmann

Das akustische Korrelat des deutschen Wortakzents

A. Mengel

1999

Zehn Jahre elektronische Sprachsignalverarbeitung im Spiegel einer Konferenz

K. Fellbaum, R. Hoffmann, D. Mehnert

Multimodale Mensch-Technik-Interaktion

S. Rapp

Klangvorstellung und Klangrealisation bei Musikern

W. Auhagen

Gegenüberstellung von Analyse durch Synthese und Rückwärtsprädikation

N. Görtz

Modellierung des Nasaltrakts

F. Ranostaj, K. Schnell, A. Lacroix

Parameterbestimmung für Pol-Nullstellen-Modelle

K. Schnell, A. Lacroix

Eine modifizierte nichtlineare Zeitachsentransformation für die spektrale Transformation von Stimmen

M. Geravanchizadeh, M. Schaaf

Ein Subband-Audio-Codec mit niedriger algorithmischer Verzögerung auf der Basis des ITU-T LD-CELP-Standards G.728

M. Prangenberg, F. Kurth, K. Fischer, J. Stegmann

Voice over IP - Eine exzeptionelle Herausforderung an die Qualität einer textabhängigen Sprecherverifizierung in der Telekommunikation

D. Hardt, R. Kapust, K. -D. Michael, S. Schönfuß

Integrating Noise Suppression in LPC-based Speech Codecs

K. Kroschel, J. Barros

Zum Einsatz fraktaler Verfahren in der Sprachkompression

S. Schneider

Sprachqualität in paketorientierten Netzen aus Benutzersicht

F. Kettler, E. Diedrich

VODIS/ VODIS Il: Sprachbedienung von Fahrer-Informations-Systeme im KFZ

J. Breuninger

Zum Einsatz von animierten sprechenden Agenten in einer Web-fähigen Stadtführer-Applikation

S. Feldes, G. Fries, A. Corbet

Ein mehrsprachiges multifunktionelles Auskunftsdialogsystem

V. Matoušek, E. Nöth

Zur Problematik der Sprachein- und -ausgabe im WWW

B. Ketzmerick

Multilinguale korpusbasierte Sprachsynthese auf der Basis domänenspezifischen Ausgangsmaterials

P. Wagner, F. Haas, K. Stöber, J. Helbig

Ein Werkzeug zur automatischen Inventargenerierung: Workflow und automatische Markierung

U. Koloska, M. Wolff, T. Rudolph

Datengetriebener Aufbau eines Aussprachelexikons — Diskussion experimenteller Ergebnisse

M. Eichner, M. Wolff

Lokal rekurrente Netzwerke zur Schlüsselworterkennung

K. Kasper, H. Reininger

Erzeugung von Phonem-Hypothesengittern für das automatische Training von Aussprachewörterbüchern

T. Rudolph, U. Netz

Robuste Kommandoworterkennung - die harten Beurteilungskriterien der Nutzer

G. Uhlrich

Application of Recognition Techniques for Mandarin Syllables to German Alphabet Recognition

H. Mixdorff, Y. -F. Liao, S. -H. Chen

Schätzung von sprecherspezifischen Vokaltraktparametern

H. Freienstein, K. Müller, H. W. Strube

Datengetriebene Vorgehensweise zur Disambiguierung linguistischer Kategorien und zur Satzendemarkierung

H. -U. Hain

Zur Machbarkeit von Synthese emotionaler Sprache ohne Modellierung der Stimmqualität

M. Schroeder

Der Einsatz elektronischer Medien in der Lehre: Die Visualisierung gesprochener Sprache in der wissenschaftlichen Ausbildung zur elektronischen Sprachsignalverarbeitung

J. Ullmann

Effizientere Nutzung von Trainingsdaten für das Wörterbuchlernen durch eine verallgemeinerte hierarchische Gliederung der Wortliste

M. Wolff

Sprachgestütztes automatisches Informationssystem auf Internet-Basis

U. Schultheiß, T. Kunkel

Ermittlung des Einflusses von Burstfehlern auf die Sprachverständlichkeit

A. Wachtler, R. Irmer

2000

Elektronische Sprachsignalverarbeitung — Stand der Technik, Zukunftsperspektiven

K. Fellbaum

Sprachsynthese vom Korpus — neue Verfahren zur Qualitätsverbesserung

W. Hess

Instrumentelle Sprachqualitätsmessverfahren für moderne Telekommunikations-Technologien

H. Klaus

Störgeräuschreduktionsverfahren für den Mobilfunk

R. Martin

Spracherkennung und Sprachsynthese auf dem Weg zur richtigen Anwendung

H. Mangold

Vergleichende Übersicht von auditiven und instrumentellen Verfahren zur Sprachqualitäts-Beurteilung im Bereich der Sprachsynthese

D. Höpfner

Störgeräuschreduktion bei mobiler Kommunikation - Möglichkeiten einer Instrumenteller Qualitätsbeurteilung

F. Kettler, H. -W. Gierlich, E. Diedrich

Robust Echo Cancellation

K. Kroschel, M. Heckmann, J. Vogel

Spektrale Transformation von Stimmen

M. Geravanchizadeh

Multilinguale Etikettierung natürlicher Sprachsignale auf Basis synthetischer Referenzsignale

G. Strecha, J. Helbig

Sprecherspezifische Charakteristika im Zeit- und Frequenzbereich

B. Ketzmerick

Ein Gateway zur sprachlichen Interaktion mit Webseiten über Telefon

S. Feldes, J. Stegmann

Building Voice Enabled Internet Portals based on VoiceXML

C. Günther, M. Klehr, S. Kunzmann, T. Roß

Evaluation der Benutzbarkeit von sprachverarbeitenden Softwaresystemen

R. Marzi

Sprachbasierte Benutzungsoberfläche für Smart-Home-Anwendungen

M. Hampicke

Dekodierung emotionaler Sprechweisen durch Patienten mit Innenohrprothese

A. C. Saß, W. F. Sendlmeier

Reduktionsanalyse mit CART

S. Breuer

Ein kombiniertes Spracherkennungs-/Sprachsynthesesystem auf Phonemebene

M. Eichner, M. Wolff, R. Hoffmann

Ausgewählte Probleme beim Test robuster Kommandoworterkenner

G. Uhlrich

Ein hybrider Ansatz zur Graphem-Phonem-Konvertierung unter Verwendung eines Lexikons und eines neuronalen Netzes

H. -U. Hain

Sprecherunabhängige automatische Lautsegmentierung unter Verwendung synthetischer Sprache: Einfluss psychoakustisch motivierter Vorverarbeitung und des Skalierungsfaktors von DTW

K. Stöber

Weiterentwicklung einer Netz-Topologie zur Generierung von FO-Verläufen

C. Erdem

Eine Entwicklungsumgebung zur Erstellung internetbasierter Tutorien für die elektronische Sprachsignalverarbeitung

M. Wolff, M. Eichner, R. Hoffmann

Fraktale Sprachkompression — praktische Erfahrungen

S. Schneider

Analyse von MRT-Daten zur Entwicklung eines vokalischen Artikulationsmodells auf der Ebene der Areafunktion

B. J. Kröger

Effiziente Vokaltraktlängennormierung in der automatischen Spracherkennung

S. Molau

Untersuchungen zu visuellen Sprechhilfen für Gehörlose

M. Pritsch

Anforderungen, Probleme und Erfahrungen zur Kommunikationsunterstützung beim multimedialen Teleteaching mit dem Schwerpunkt der Sprachkommunikation

H. -J. Ullmann

Dialogsysteme in eCommerce für Behinderte

V. Matoušek

Robuste Sprachsignalerfassung im KFZ durch Ortung und Beamformung auf den Mund des Sprechers

K. Tontch

Probleme und Lösungen zur automatisierten Implementierung von Sprach-Erkennungssystemen

C. -M. Westendorf

Entwicklung und technische Realisierung eines interaktiven Sprachtrainers für Hör- und Sprechgeschädigte

W. Friedhoff, R. Ichmann, R. Ose

2001

Achtzig Jahre Phonetik an der Universität Bonn

Wolfgang Hess

Zum Design von Sprachqualitätsmessungen für Sprachsynthese-im-Gebrauch: Einige grundlegende Aspekte

Ute Jekosch

Phonetische Variation als Funktion unterschiedlicher Sprechstile

Walter F. Sendimeier

Untersuchung der Faktoren Dauer und Koartikulation bei der Modellierung von Sprechgeschwindigkeit in der Spracherkennung

Britta Wrede, Gernot A. Fink, Gerhard Sagerer

Lichtsteuerung per Sprache - eine greifbare Vision Realisierungsaspekte einer nutzerakzeptablen Sprachsteuerung für die gesamte Wohnung

Günter Uhlrich

Erweiterung der Heuristischen Evaluation für sprachgesteuerte Softwaresysteme - Ergebnisse der Evaluation

H. Klemmert, H. Brau, Ruth Marzi

Aufbau und Optimierung eines deutschsprachigen Spoken Document Retrieval Systems für Bundestagsreden

Konstantin Biatov, Martha Larson, Joachim Köhler

Weighted Fusion of Audio and Video Data for Robust Speech Recognition

Kristian Kroschel, Thorsten Wild, Martin Heckmann, Frederic Berthommier

Structure-motivated lexicon refinements for German language LVCSR

Martha Larson

Vorwärtsmarkierung für cepstrum-basierte Spracherkennungssysteme

Sascha Wendt, Gernot A. Fink, Franz Kummert

Das Projekt ALERT: Entwicklung eines deutschen Spracherkennungssytems für Radio- und Fernsehnachrichten

Steffen Werner, Andreas Kosmala, Gerhard Rigoll

BLF - Ein Labelformat für die maschinelle Sprachsynthese mit BOSS II

Stefan Breuer, Julia Abresch, Petra Wagner, Karlheinz Stöber

Eine vergleichende Untersuchung von Markup Languages für Sprachdialoganwendungen

Rachid Elyoussfi, Christoph Luber, Stefan Feldest, Ulrich Schultheiß

Evaluation der Qualität deutscher Sprachsynthesesysteme mit Hilfe auditiver Hörtest

Dirk Höpfner

Das funktionale Artikulationsmodell FART: Modellierung von zeitlicher und räumlicher Koartikulation

Bernd J. Kröger

Visuelle Sprechhilfen für Hörbehinderte

Marcus Pritsch

Synthese von Vokalen mit einem Oszillatormodell unter Berücksichtigung der Stimmlosen Anregung

Erhard Rank

Gestaltung von Testumgebungen zur Beurteilung von Sprachproben

Christian Richter

Zur Akzentuierung semantischer und pragmatischer Fokusse

Hans-Christian Schmitz, Bernhard Schröder, Petra Wagner

Entwicklung und Einsatz automatischer Sprach-Übersetzung für Telefon-Dienste

Christiane Thielemann, Stefan Feldes, Christoph Luber

Sprachverstehen und Dialogplanung in einem multimodalen Kommunikationssystem mit gemischter Dialog-Initiative und virtueller Agentin

Stefan Feldes, Georg Fries

Ein Dialogsystem für blinde und sehbehinderte Programmierer

Vaclav Matoušek, Roman Mouček, Karel Taušer

Auditive und instrumentelle Verfahren zur Sprachqualitätsmessung - eine vergleichende Übersicht

Klaus Fellbaum, Dirk Höpfner, T. Lüdtke

Assessment of Quality for Audio-Visual Signals over Internet and UMTS

Harald Klaus

Multiple Descriptions and Missing Data Estimation for Voice over Packet-Switched Networks

Rainer Martin, Frank Mertz

Test- und Optimierungsmöglichkeiten in Voice over IP-Szenarien

Frank Kettler, Hans Wilhelm Gierlich, Frank Rosenberger

Generierung von Betonungsmarkern für ein multilinguales Sprachsynthesesystem

Achim F. Müller, Rüdiger Hoffmann

Datengetriebene Optimierung von Eingangsgrößen der Prosodiegenerierung

Çağlayan Erdem, Hans Georg Zimmermann, Rüdiger Hoffmann

Relevanz der Prosodie für die Simulation von Sprechstilen in synthetischer Sprache

Hans Kruschke

Resynthese von Sprachsignalen mit Kettenfiltern durch periodensynchrone Analyse und lautunabhängige Anregung

Karl Schnell, Arild Lacroix

Der Einsatz von Text to Speech in den Informationsdiensten der DTAG

Kerstin Fettke

Sprachsynthese bei orthographischen Fehlschreibungen

Reinhold Greisbach, Frank Christian Stoffel

Speech Spectrum Smoothing by Homomorphic Processing

Robert Vich, Jir̆i Pr̆ibil

Sprachdialog für die Unterstützung bei der Fehlerdiagnose an CNC-Werkzeugmaschinen

Ruth Marzi, P. John

Optimierung der Eingabe eines neuronalen Netzes zur Bestimmung der Wortbetonung mit Hilfe von Weight Decay

Horst-Udo Hain, Hans Georg Zimmermann

Einschwingphase von Vokalen bei emotionaler Sprechweise

Astrid Paeschke, W.F. Sendlmeier

Comparing a Data-Driven and a Rule-Based Approach to Predicting Prosodic Features of German

Hansjörg Mixdorff, Oliver Jokisch

Stimmklang und Sprechtempo als charakteristische Merkmale von Stimme

Bettina Ketzmerick

Untersuchungen zum statistischen Zusammenhang zwischen orthographischer und phonetischer Repräsentation deutscher Wörter

Matthias Wolff, Matthias Eichner

Eine neue Sprachdatenbank mit der Sprache unter Stress

Milan Sigmund, Ondřej Severnak

Systematische Überprüfung deutscher Wortbetonungsregeln

Petra Wagner

2002

Prof. Dr.-Ing. habil. Walter Tscheschner — Laudatio zum 75. Geburtstag

D. Mehnert

R und kein Ende

H. Ulbrich

Japanese speech recognition

D. Langmann

Über die Evolution von Voice-Portalen

V. Naumburger

Digitale Signalverarbeitung für akustische Mensch/Maschine-Schnittstellen

W. Kellermann, W. Herbordt, Herbert Buchner

Lip parameter extraction for speechreading

Kristian Kroschel, Martin Heckmann

Anwendung einer robusten Sprachsteuerung im „Smart Home“ sowie im industriellen Umfeld

Günter Uhlrich

Ein Simulationssystem zur Untersuchung des Einflusses von Übertragungskanälen bei Smart-Home-Anwendungen

J. Krebber, Sebastian Möller, Alexander Raake, S. Rehmann, Jens Berger, W. Johannsen

EU-Förderprojekt VAMP für Applikationen der elektronischen Sprachsignalverarbeitung

G. Wolf, T. Reichert

Spracheingabe bei der technischen Inspektion von Kraftfahrzeugen

J. Helbig, B. Schindler

Regulierbare Verarbeitungsgeschwindigkeit automatischer Spracherkennungssysteme durch dynamische Suchraumeinschränkung

Sascha Wendt, Gernot A. Fink, Franz Kummert

Akustische, mobile Fernunterstützung bei der Fehlerdiagnose an CNC-Werkzeugmaschinen

Ruth Marzi, P. John

Optimierung der Erkennungsleistung von sprecherabhängigen, HMM-basierten Spracherkennem

Ronald Römer, Uwe Koloska, Diane Hirschfeld

Automatische Segmentation für ein regionales Sprachkorpus des Deutschen

F. Greisbach, Frank Christian Stoffel, M. Warnking

Mixed-unit language models for German language automatic speech recognition

Martha Larson, S. Eickeler, Konstantin Biatov, Joachim Köhler

Automatische Auswertung von Radio- und Femsehnachrichten: Fortschritte in der Spracherkennung und Themenidentifikation

U. Iurgel, Andreas Kosmala, S. Werner

microDRESS - ein TTS-System mit geringem Ressourcenbedarf

Rüdiger Hoffmann, Hans Kruschke, Guntram Strecha, M. Küstner, Markus Schnell, Oliver Jokisch, Diane Hirschfeld

Towards multimodal interfaces for embedded devices

Volker Fischer, Carsten Günther, J. Ivanecky, J. šedivy, L. Ureš

The SBF1005T IC - A versatile platform for embedded speech technology and pattern recognition solutions

T. Hase, D. Langmann

Sprachdialoge für Embedded-Anwendungen

M. Küstner

Network-based vs. distributed speech recognition in adaptive multi-rate wireless systems

Tim Fingscheidt, S. Aalburg, Sorel Stan, Christophe Beaugeant

Entwicklungsschritte eines Hardware-Kommandoworterkenners mit minimalem Footprint

Diane Hirschfeld, J. Bechstein, Uwe Koloska, T. Richter, Rico Petrick

Von der sprechenden Maschine zum kommunikativen Auto

A. Weil

Rapid Prototyping für Embedded-Sprachapplikationen

R. Coppens, R. Sambeth

Design von Benutzerschnittstellen für Sprachbediensysteme im KFZ

Bärbel Jeschke

The tight relation between acoustic echo cancellation and residual echo suppression by postfiltering

G. Enzner, Peter Vary, Rainer Martin

Confidence scoring of time difference of arrival estimation for speaker localization with microphone arrays

Dirk Bechler, Kristian Kroschel

Analyse und Erzeugung von Nasalvokalen mittels verzweigter Rohrmodelle

Karl Schnell, Arild Lacroix

Separate Messung und Analyse von Mund- und Nasensignalen bei natürlicher Sprache

M. Bettinelli, Karl Schnell, Arild Lacroix

Messung und Simulation der Akustik des Nasaltrakts

F. Ranostaj, Arild Lacroix

Experimente mit der Anwendung der Pseudokorrelation bei der Vokaltraktmodellierung

Robert Vích

Distanzcodierung für asynchrones CDMA

W. Zühlke

Die Verwendung von DTW für die instrumentelle Qualitätsbeurteilung von Sprachsynthese: Chancen und Probleme

Karlheinz Stöber

Umsetzung semantischer Konzepte in gesprochene Sprache

Markus Schnell

Syntax and prosodic phrasing in news reading

Hansjörg Mixdorff

Regelbasierte Generierung fremdsprachlich akzentgefärbter Aussprachevarianten

Stefan Schaden

Temposteuerung in der Sprachsynthese durch prosodische Phrasierung

Jürgen Trouvain

Sprachmodell-Berechnung beim Übergang auf eine neue Anwendung

J. Adelhardt, E. Nöth, G. Stemmer, H. Niemann

Generierung sprechstilspezifischer Prosodie mit einem datenbasierten Lermverfahren

Hans Kruschke, Oliver Jokisch

Quantitative Untersuchung zur Prosodie des Neuhebräischen

M. Görsch, G. Splittgerber, Hansjörg Mixdorff

Selection of non-uniform units and acoustic prosody parameters by syllable based optimality criterions

C. Erdem, F. Beck

Über die Rolle der Audio-Komponente bei der Multimedia-Kommunikation

Klaus Fellbaum, Bettina Ketzmerick

Untersuchungen zum Einsatz von Sprachtechnologien in der Lernumgebung eines intemetbasierten Studienganges

Matthias Eichner, Matthias Wolff

Embotionalität im multimodalen Mensch-Maschine-Dialog: Ein Integrationsansatz

A. Wirth, Stefan Feldes, Karlheinz Schuhmacher

Dialogsystementwicklung mit einer Offenen Voice Application Platform (OVAP)

T. Winterkamp

Zum Einsatz akustischer Komponenten im E-Leaming-Modul „Elektronische Sprachsignalverarbeitung“

Bettina Ketzmerick

Entwurf eines Frameworks für audiovisuelle Sprachsynthesesysteme

Sascha Fagel, Walter F. Sendlmeier

Implementierung von Dialogmodellen in VoiceXML

Václav Matoušek, J. Schwarz

Sprachoberfläche für PDA-Applikationen

U. Schultheiss, T. Müller, V. Munde, A. Weil

Erhöht gesprochene Interaktion die Nutzungsfreundlichkeit von Software? Ergebnisse einer empirischen Studie

H. Klemmert, C. Stock, Ruth Marzi

Optimierung internetbasierter auditiver Sprachgütemessungen

Christian Richter

Das automatische Fahrplanauskunftssystem DORIS

G. Flach, U. Jung

2003

CHIL Computing to Overcome Techno Clutter

A. Waibel

Hybrid Analytic/ANN-Based Acoustic-Phonetic Decoding

K. Ekštein, V. Matoušek, R. Mouček

Mel-Freguenzanpassung der Minimum Varianz Distortionless Response Einhüllenden

M. Wölfel

Adaptive Audio-Visual Speech Recognition in the Presence of Audio and Video Distorsions

M. Heckmann, K. Kroschel, F. Berthommier, C. Savariaux

An Experimental Framework for Lipreading

I. Shdaifat, R. Grigat, D. Langmann

Robuste Phrasendetektion durch zweistufige Sprach/Pause-Detektion

T. Richter, Rico Petrick, Diane Hirschfeld

Entwicklung und Optimierung automatischer Bestimmung der Wortgrenzen

L. Dzbanek, M. Sigmund

Chorus Detection in Songs of Pop Music

V. Mildner, P. Klenner, K. D. Kammeyer

Vergleich von automatischer und manueller Segmentierung von Fernsehnachrichten und deren Einfluss auf die Sprach- und Themenerkennung

U. lurgel, S. Werner, Gerhard Rigoll

Automatic Segmentation and Labeling of Speech Signal

K. Ekštein, V. Matoušek, T. Pavelka

Robust Speech Recognition Based on Localized Spectro-Temporal Features

B. Meyer, M. Kleinschmidt

Domänenspezifische Sprachmodelle und Konfidenzmaße für die Domänendetektion und die Verringerung von Erkennungsfehlern

A. Berton, H. Hüning, H. Kretzschmar

Importance of Early and Late Reflections for Automatic Speech Recognition in Reverberant Environments

H. Gölzer, M. Kleinschmidt

Joint Source-Channel Coding for Coded Speech Transmission

N. Görtz

Emotionserkennung in einem automatischen Dialogsystem: Ist der Mensch besser als die Maschine?

V. Zeißler, J. Adelhardt, E. Nöth

Auswirkungen affektiver emotionaler Sprecherzustände auf das Schwingverhalten der Stimmlippen

R. Winkler, W. Sendlmeier

Signalverarbeitungskomponenten zur Verbesserung der Kommunikation in Fahrzeuginnenräumen

T. Haulick, G. Schmidt

Mehrkanalige Geräuschunterdrückungssysteme mit adaptiver Selbstkalibrierung

M. Buck

Untersuchungen zum Einsatz von Mikrofonarrays in Verbindung mit Spracherkennungssystemen

G. Uhlrich, D. Schuchardt, H. Baesekow

Laufzeitgesteuerte Echokompensation in IP basierenden Telefonnetzen

W. Brandstätter, Frank Kettler

Multimodale Sprecherlokalisation für Mensch-Roboter-Interaktionen in einer Multi-Personen-Umgebung

S. Hohenner, S. Lang, M. Kleinehagenbrock, G. A. Fink, F. Kummert

Evaluation of the precedence effect for speaker localization using microphone arrays

D. Bechler, L. Cridlig, K. Kroschel

Comparison of two Realisations of a Differential Microphone Array for Spectral Subtraction

M. Ihle

Modellierung der Sprachproduktion mit einem biomechanischen Zungenmodell

P. Perrier

Verwendung eines Sprachmodells zur Modellierung und Synthese von Spontansprache

S. Werner, M. Eichner, M. Wolff, R. Hoffmann

Sprachanalyse und -erzeugung mit verlustbehafteten zeitdiskreten Rohrmodellen

K. Schnell, A. Lacroix

Evaluation eines Sprachsynthesesystems nach dem Prinzip der Nonuniform Unit Selection

R. Hammerstingl, S. Breuer

Instrumentelle und auditive Qualitätsbeurteilung bei der korpusbasierten Sprachsynthese

E. Paulus, J. Steffens

Muss synthetische Sprache immer langweilig klingen?

Jürgen Trouvain

Akustisch-Phonetische Merkmale in verschiedenen Stilen gelesener Sprache

H. Kruschke

Das audiovisuelle Sprachsynthesesystem MASSY - Implementierung und Optimierung

S. Fagel, W. F. Sendlmeier

Videorealistische audiovisuelle Synthese basierend auf Unitselection

C. Weiss

PEMO_Q - Audio Quality Assessment Using a Model of Auditory Perception

R. Huber, B. Kollmeier

Construction of an individualized visual speech-synthesizer from orthogonal 2D-images

A. Niswar, K. Kroschel

Prosodiemodellierung im freien Text-to-Speech-System Epos mit neuronalen Netzen

P. Horák, D. Sobe

Preprocessing and Prosody Generation for a TTS System with a Very Small Footprint

H. -U. Hain, T. Volk, T. Fingscheidt

Ein Experimentalsystem zur Sprachakustik und Sprachproduktion

F. Ranostaj, A. Lacroix

Sprachsignalverarbeitung in der Automobilindustrie

J. Schultz, H. Wengelnik, G. Gruchalski

Sprachsignalverarbeitung für den Mobilfunk: Eine Übersicht und Trendanalyse

M. Ihle

A Text-Independent Speaker Verification Approach for Mobile Devices

P. Setiawan, S. Aalburg, T. Fingscheidt, S. Stan, G. Ruske

Skalierbare Voice-Plattform mit Unterstützung multimodaler Interaktion

G. Boi, L. Both, F. Englert, K. Kasper, L. Krejsa, H. Reininger, G. Schmidt, K. Sehnert, M. Thiel, M. Wagner

Elektronische Sprachsignalverarbeitung in der industriellen Anwendung - Ergebnisse des EU-Förderprojektes VAMP

G. Wolf, T. Reichert

Sprachsteuerungen im Praxistest - Das Apollo-Korpus

Jens Maase, Diane Hirschfeld, Uwe Koloska, J. Helbig

Aktuelle Entwicklungen in der Messtechnik für KFZ-Freisprecheinrichtungen

F. Kettler, H. -W. Gierlich, D. Eickenhorst

Automatische Sprachverarbeitung von Funksignalen

T. Wolf

Audio-Komponenten beim e-Learning - eine erste Bestandsaufnahme

K. Fellbaum, B. Ketzmerick

Visuelle Kommunikationshilfen für Gehörlose

M. Pritsch

"Let Them Speak" - Voice technology for industrial applications - VAMP projects in Italy

M. Sartori

Application of speech technology for alarm systems and disabled persons - VAMP projects in Greece

I. Varvitsioti, T. Menexelis, N. Panagopoulos

Sprachtechnologien in der Lernumgebung eines Internet-basierten Studienganges

M. Eichner, M. Kühne, S. Werner, M. Wolff

2004

Sensing People - Localization with Microphone Arrays

Peter Noll, Markus Schwab, Wilbert Wiryadi

Ambient Intelligence - Vision und technische Lösungsansätze

Christian Hentschel

Schlüsselinnovationen, Pilotprodukte und Thesen für Sprachverarbeitung bei Wearable Computing

Astrid Ullsperger

Realisierung eines Sprachdialogsystems mit einer robusten Spracherkennung

Hans-Günter Hirsch

Revisiting some Model-Based and Data-Driven Denoising Algorithms in Aurora-2-Context

Panji Setiawan, Sorel Stan, Tim Fingscheidt

System of an Automatic Speech Recognition and Speech Understanding LINGVO/LASER

Václav Matoušek, Kamil Ekštein, Tomáš Pavelka

Stimmaktivierung eines Spracherkenners

Marco Kühne, Matthias Wolff

Flexible Decision Trees for Grapheme Based Speech Recognition

Borislava Mimer, Sebastian Stüker, Tanja Schultz

Multiquellentraining: Chancen für kleine Trainingsmengen in der automatischen Spracherkennung

Matthias Wölfel

Fehlertolerante Multimodale Fusion von N-Besten Listen von Spracheingabe und Zeitgesten

Hartwig Holzapfel, Alex Waibel

Detektion unbekannter Wörter in der automatischen Erkennung spontaner Sprache

André Berton, Olaf Schreiner

Erkennung von Sprache aus einem parametrisierten Signal mit Hilfe der digitalen Bildverarbeitung

Lukáš Džbánek, Andy Kuiper, Milan Sigmund

Domänenspezifische Optimierung eines bidirektionalen Sprachübersetzungssystems in verteilter Architektur

Michael Stier, Stefan Feldes

Bestimmung der optimalen HMM-Parameter zur robusten, phonembasierten Spracherkennung

Harald Finster, Hans-Günter Hirsch

Wiedererkennung von Audiosignalen - Verfahren und Anwendungen

Christian-M. Westendorf

Verstärkungslernen zur Prosodievorhersage in einem Sprachproduktionssystem

Markus Schnell

Voice Conversion Based on Spectral Envelope Transformation

Robert Vich, Martin Vondra

Neue Ansätze zur Sprachsynthese mit kodierten Sprachsegmenten

Guntram Strecha

Verkettung von Spracheinheiten für die Spracherzeugung mittels verlustbehafteter Rohrmodelle

Karl Schnell, Arild Lacroix

Text-to-Speech im Rundfunk - Der programmierbare Moderator?

Thomas Schierbaum

Optimierung einer trainingsbasierten Prosodiegenerierung für Sprachsynthese

Oliver Jokisch, Michael Hofmann

LexDRESS - Speech Synthesis for a Speaking Pronunciation Dictionary - First Results

Rüdiger Hoffmann, Ursula Hirschfeld, Oliver Jokisch, Lutz C. Anders

Rule Based Sounds Duration Model for the Czech TTS System

Petr Horák

Markov-Entropie basierte Auswahl geeigneter Sprachsegmente für korpusbasierte Sprachsynthese-Systeme

Christian Weiss

Analyse nasalierter Vokale unter Berücksichtigung getrennter Mund- und Nasensignale

Matthias Geueke, Arild Lacroix

Improved Time Delay Estimation Exploiting Redundancy in Microphone Arrays

Dirk Bechler, Kristian Kroschel

Modelle der Nasalierung in SPEAK

F. Ranostaj, Arild Lacroix

Integrierte multimodale Sprachdatenverwaltung mit dem WiGE System

Uwe Koloska, Diane Hirschfeld

Modellierung von Lautübergängen mittels nichtlinearer Trajektorien der Vokaltraktflächen

Karl Schnell, Arild Lacroix

Ein effektiver Algorithmus zur kombinierten Echokompensation und Geräuschreduktion in Freisprechanwendungen

Rico Petrick, Christian Gruber, Michael Fenske

Standards-based Multimodal Interface for Mobile Devices

Carsten Günther, Markus Klehr, Siegfried Kunzmann

Zum Einsatz und Nutzen elektronischer Sprachkomponenten im Wohnbereich für die Zielgruppe der älteren Menschen

Maik Hampicke

Eine mobile Interaktionsplattform für multimodale Interaktion

Giancarlo Boi, Klaus Kasper, Lubos Krejsa, Kerstin Reichel, Herbert Reininger, Bernd Schindler

Einfluss von Paketverlusten auf die Qualität von Spracherkennung und Sprachsynthese

Sebastian Möller, Jan Krebber, Alexander Raake

Mobile Informationssysteme mit integrierter Spracherkennung und Sprachsynthese

Jens Estelmann, Uwe Koloska

Robuste Spracherkennung im Cockpit von Luftfahrzeugen

Michael Dambier, Matthias Wölfel, Christian Fügen

Sprachsteuerung eines Computerspiels - Untersuchungen zur Leistungsfähigkeit und Ergonomie

Daniel Sobe, Matthias Eichner

2005

A phonetician's view of signal generation for speech synthesis

Eric Keller

Psychoacoustic experiment in the research of musical sound timbre

Jan Stepánek

2006

Sprache im Kontext sozial- und humanwissenschaftlicher Forschung

Lutz-Michael Alisch

Automatisierte Musikdatenerschließung

Meinard Müller, Frank Kurth

Zur Kommunikation bei gestörtem Hörvermögen - Möglichkeiten der technischen Unterstützung

K. Fellbaum, M. Pritsch

2007

SmartWeb - Mobile Dialogic Access to the Semantic Web

Norbert Reithinger

Sinn und Unsinn von akustischen Komponenten: Einsatz von akustischen Komponenten in Medien

Andrea Rögner

Comparison and Analysis of the Susceptibility of Wideband and Telephone-band Speech to Various Environmental Additive Noise Sources

Deepa Janardhanan, Ulrich Heute

Evaluation of Vocal-Facial Based Emotion Primitives

Kristian Kroschel, Michael Grimm, Vasilije Krstanovic

Zur auditiven und apparativen Charakterisierung von Stimmen

Bettina Ketzmerick

Einkanalige Störgeräuschunterdrückung zur Steigerung der Worterkennungsrate eines Spracherkenners

Sören Wittenberg, Rico Petrick, Matthias Wolff, Rüdiger Hoffmann

Unterstützende Sprachübersetzung in Telefonkonferenzen

Martin Eckert, Stefan Feldes, Karlheinz Schuhmacher, Ralf Kirchherr, Joachim Stegmann, Florian Metze

Gender Recognition and Gender-based Acoustic Model Adaptation for Telephone-based Spoken Dialog System

Kinfe Tadesse Mengistu, Martin Schafföner, Andreas Wendemuth

Czech Explanatory Dictionary and its Computer Implementation

Václav Matoušek, Jana Michalicová, Roman Mouček

Vergleichende Untersuchungen zur Erkenngenauigkeit Pitch-kohärenter Merkmale bei verschiedenen Störgeräuschen unter Verwendung der Aurora-2-Datenbasis

Ronald Römer, Raymond Brückner

Eine Datenbank für Untersuchungen zur Sprecheridentifikation und Sprecherverifikation

Stephan Euler, Christian Pilz

LDec: One Pass Time Synchronous Decoder

Tomás Pavelka, Václav Matoušek

HSVM - A SVM Toolkit for Segmented Speech Data

André Stuhlsatz

KorpusDress1 - Korpusbasierte konkatenative Sprachsynthesesysteme

Hamurabi Gamboa Rosales, Oliver Jokisch

Ein zeitvariabler linearer Prädiktionsalgorithmus für die Sprachverarbeitung

Karl Schnell, Arild Lacroix

Adaptive Comb Filtering in Speech Enhancement by Spectral Subtraction

Martin Vondra, Robert Vich

ASR Failure Prediction Based on Signal Measures

Lu Huo, Ulrich Heute

Richtmikrofon mit digitaler Signalverarbeitung

Dietmar Richter

SNR-Based Assessment of Quality of Speech Enhancement Using Single-Channel Methods

Zdenek Smékal, Robert Vich

How to Access Large Navigation Databases in Cars by Speech

André Berton, Sandra Mann, Peter Regel-Brietzmann

Personalisierte Sprachinteraktion zur Priorisierung von Internet-Informationen im Auto

Philipp Fischer, André Berton, Peter Regel-Brietzmann

Ein interaktives Tutorial für ein Sprachbediensystem im Fahrzeug

Franziska Höhne, Bärbel Jeschke, Klaus Fellbaum

Design von Sprachdialogen für das KFZ - Stand der Technik

Bärbel Jeschke

Akustische Echtzeitnachbildung eines Fahrzeuginnenraums und einer fernen Gegenstelle

Mohamed Krini, Samuel Ngouoko, Gerhard Schmidt

A Multimodal Dialogue System for Interacting with Large Audio Databases in the Car

Sandra Mann, André Berton, Ute Ehrlich

Wahrgenommene Sprachqualität in Telefongesprächen bei zeitlich variierenden Übertragungseigenschaften

Benjamin Weiss, Sebastian Möller, Jens Berger

Broker-Software zur generischen Realisierung multimodaler Applikationen auf konventionellen Sprachplattformen

Michael Buschbeck, Klaus Kasper, Herbert Reininger, Lubos Krejsa, Martin Wagner, Sven Lehnen, Matthias Thiel, Lars Both

Ein taktil-akustischer Plan eines Liniennetzes für blinde Personen

Peggy Nachtigall, Klaus Fellbaum

Untersuchungen zeitskalierter Sprachwiedergabe mit normal sehenden, sehbehinderten und blinden Probanden

Dirk Höpfner

Support Vector Machines - Eine Einführung

Steffen Werner

2008

Experimente zum Übertragungsverhalten Mareyscher Kapseln

Dieter Mehnert, Rolf Dietzel, Dietmar Richter, Jürgen Landgraf

Experimente mit dem Teager Energie Operator

Robert Vich, Martin Vondra

Analysis of PARADISE Models for Individual Users of a Spoken Dialog System

Klaus-Peter Engelbrecht, Sebastian Möller, Robert Schleicher, Ina Wechsung

Gemeinsamkeiten und Unterschiede in den Aussagen von Versuchspersonen in Einschätzungstests

Erwin Paulus

Robust Sound Source Identification for a Humanoid Robot

Alexej Swerdlow, Timo Machmer, Benjamin Kühn, Kristian Kroschel

Früherkennung von Hörstörungen durch objektive Hördiagnostik

Mario Cebulla

Towards User Group Dependent Acoustic Models

Kinfe Tadesse Mengistu, Andreas Wendemuth

Semantic Range of Spoken Dialogue Systems

Roman Mouéek, Miloslav Konopik

Was möchten Sie hören? - Zielsicheres Suchen in großen Datenmengen mit integrierten multimodalen Systemen

Marcel Dausend, André Berton, Alfred Kaltenmeier, Sandra Mann

Towards Semantic Analysis of Spoken Queries

Miloslav Konopik, Václav Matoušek, Roman Mouček

Untersuchungen zur automatisierten Umsetzung von Sprachdialogen mittels eines Model-Driven-Ansatzes

Thomas Langholz, Klaus Kasper, Michael Buschbeck, Herbert Reininger, Kerstin Sehnert

Sprachgestützte multimodale Navigation in einem Videoportal auf mobilen Endgeräten

Christian Weiß, Stafan Feldes, Thomas Kremer, Karlheinz Schuhmacher, Ralf Kirchherr, Joachim Stegmann, Ina Wechsung, Anja Naumann

"Beethoven's Ninth" - An Experiment on Naming Usage for Audio Files

Sandra Mann, André Berton, Marcel Dausend, Paul Heisterkamp

The EURONOUNCE Project — An Intelligent Language Tutoring System with Multimodal Feedback Functions: Roadmap and Specifications

O. Jokisch, R. Jäckel, M. Rusko, G. Demenko, N. Cylwik, A. Ronzhin, D. Hirschfeld, U. Koloska, L. Hanisch, R. Hofmann

Erweiterung eines HMM - basierten Spracherkennungssystems für die Zustandsüberwachung beweglicher Maschinenteile

S. Wittenberg, R. Hoffmann

Multilingual Acoustic Features for Porting Speech Recognition Systems to New Languages

S. Stüker

Verbesserung der automatischen Transkription von englischen Wörtern in deutschen Vorlesungen

S. Ochs‚ M. Wölfel, S. Stüker

Adaptation of Frequency Band Influence for Non-Native Speech Recognition

M. Raab, T. Herbig, R. Brueckner, R. Gruhn, E. Nöth

Ein zeitvariabler Burg-Algorithmus für die Sprachanalyse

K. Schnell, A. Lacroix

Evaluation of Automatic Speech Emotion Recognition Based on Gaussian Mixture Models

M. Vondra, R. Vich

Advances in Anger Detection with Real Life Data

F. Burkhardt, R. Huber, J. Stegmann

Signalbearbeitung und Erweiterung durch externe Module im Programm FBview

S. Euler

Einfluss der Pitchmarkierung auf die Qualität der konkatenativen Sprachsynthese

H. Gamboa Rosales

Nichtlinearer Zeitskalierungsalgorithmus für gespeicherte natürliche Sprache

D. Höpfner

Einzelfallstudie zu Grenzen der Verständlichkeit ultra-schneller Sprachsynthese

A. Moos, J. Trouvain

Phonetic Analysis and Redesign Perspectives of Artificial Speech Bandwidth Extension

P. Bauer, T. Fingscheidt, M. Lieb

Noise Reduction with Adaptive Maximum Attenuation

M. Krini, G. Schmidt

Speaker Localization - Novel Algorithm and Practical Aspects

N. Madhu, D. Oswald, R. Martin

Independent Component Analysis (ICA)

M. Eichler

2009

Semantische Dialogmodellierung mit gewichteten Merkmal-Werte-Relationen

Markus Huber, Christian Kölbl, Robert Lorenz, Ronald Römer, Günther Wirsching

Konzeptionelle Beschreibung des cortikalen Algorithmus und seine Anwendung in der Automatischen Sprachverarbeitung

Ronald Römer, Tobias Herbig

Merkmalsextraktion für die Spracherkennung

Christian Lüke, Karl Schnell

Example-based Realization of Isolated Words Recognizer under Limited Training Data Constraint

Petr Zelinka, Milan Sigmund, Detlef Richter

Ein echtzeitfähiges Verfahren zur Erkennung von Babyschreien

Renán Véliz, Stefan Feldes

Grammar-based Dialogue Management Techniques

Václav Matoušek, Tomáš Nestorovič

Sprachsteuerung für mobile ortsbasierte Internet-Dienste

Carsten Günther, Mathias Jöst, Marion Mast, Markus Klehr

Modellbasierte Generierung von Sprachdialogen für eingebettete Systeme

Uwe Koloska, Matthias Pohl

Ein Sprachdialogsystem mit begrenzten Hardwareressourcen

Frank Duckhorn, Guntram Strecha, Matthias Wolff, Rüdiger Hoffmann

AvatR – Audio visual assistant turns Real

Robert Granich, Herwig Weidle, Toni Homuth, Niels Baumbach

Von der Schmalband-Telefonie zur Mobilen Audio-Kommunikation

Peter Vary

Nichtkausales cepstrales Sprachmodell

Robert Vích

Evaluation of Information Contained in Spectral Features

Harald Höge, Panji Setiawan

Kombinierte Ansätze zeitvariabler und zeitinvarianter Modellanalysen für die Sprachverarbeitung

Karl Schnell, Arild Lacroix

Dereverberation of Speech Signals Based on the Discrete Model of Speech Production

Marco Jeub, Peter Vary

Mehrkanaliges akustisches Front-End für Spracherkennungssysteme

Thomas Fehér, Rico Petrick, Rüdiger Hoffmann

Modellbasierte Verbesserung von Sprachverständlichkeit in Hörgeräten

Anton Schlesinger, Marinus M. Boone

Multi-Channel Speech Enhancement for Car Applications

Huajun Yu, Tim Fingscheidt

RTPROC: Rapid Real-time Prototyping for Audio Signal Processing

Hauke Krüger, Thomas Schumacher, Thomas Esch, Bernd Geiser, Peter Vary

Extending Monaural Speech and Audio Codecs by Inter-Channel Linear Prediction

Magnus Schäfer, Hauke Krüger, Peter Vary

Implementation of a Superdirective Beamformer based on an Extended Modal Subspace Decomposition

Martin Eichler, Arild Lacroix

Artikulatorische Sprachsynthese

Bernd J. Kröger, Peter Birkholz

Emotional Speech Synthesis: Applications, History and possible Future

Felix Burkhardt, Joachim Stegmann

Applications of HMMs for the Recognition of Emotional Sequences in the Valence-Arousal Space

David Hübner, Ronald Böck, Andreas Wendemuth

On the Influences of Feature Extraction in Single Emotion Recognition in Naive vs. Acted Speech

Ronald Böck, David Hübner, Andreas Wendemuth

Multilingual Voice Analysis: Towards Prosodic Correlates of Voice Preference

Horst-Udo Hain, Oliver Jokisch, Luis Coelho

Russian Text-to-Speech Synthesis System for Mobile Telephones

Liliya Tsirulnik, Dmitry Pokladok

Evaluation of F0 Stylisation Methods and Fujisaki-Model Extractors

Hartmut R. Pfitzinger, Hansjörg Mixdorff

Parameter estimation and prediction from text for a superpositional intonations model

Humberto M. Torres, Jorge A. Gurlekian

Sprachtechnologie zur Unterstützung von Menschen mit Sinnesbehinderungen

Klaus Fellbaum

Einsatz von Sprachanwendungen im Ambient Assited Living (AAL) – Rückblick, aktueller Stand und Zukunftsperspektive

Maik Hampicke

Nachbildung von Störungen der Hör- und der Sehbahn für Studien an technischen Kommunikationshilfen

Sermed Al-Hamdani, Hans-Heinrich Bothe

Verstehbarkeits-Untersuchung synthetisch geglätteter Intonationsstrukturen in zeitskalierter Sprache

Dirk Höpfner

SignSpeak - Bridging the gap between signers and speakers

Philippe Dreuw, Hermann Ney

Zur Kommunikation zwischen Gehörlosen und Normalhörenden

Jens Lindemann

Barrierefreies Informieren und Kommunizieren mittels Spracherkennung

Christiane Berndt, Rainer G. Spallek

Sprachqualität in drahtlosen Next Generation Networks - Einflüsse von Netzwechseln im Konversationsversuch

Sebastian Möller, Niklas Kirschnick, Blazej Lewcio, Pablo Vidales, Marcel Wältermann

Speech Quality of wideband VoIP under packet loss

Alexander Raake, Marcel Wältermann, Nicolas Côté, Sebastian Möller

Vollduplex-Kommunikation in Kiosk- und Konferenzsystemen

Christian Gruber

Sprachsynthesesysteme für den Einsatz im KFZ - Untersuchungen zur Sprachqualität

Nadya Stoyanova, Steffen Werner

Signalbasierte musikalische Ähnlichkeitssuche im Praxiseinsatz

Matthias Eichner, Dirk Schönfuß

Vergleich statistischer Klassifikatoren zur Ermittlung musikalischer Aspekte

Stephan Hübler, Matthias Wolff, Matthias Eichner

Beurteilung von Klavieren anhand messtechnisch gewonnener Merkmale

Gunter Ziegenhals

Development of a Computer-Aided Language Learning Environment for Mandarin – First Steps

Hansjörg Mixdorff, Daniel Külls, Hussein Hussein

Lexikalische Modellierung fremdsprachlicher Akzente – Methoden, Möglichkeiten und Grenzen eines regelbasierten Ansatzes

Stefan Schaden

Training of HMMs for Pronunciation Error Detection – Crosslingual Bootstrapping vs. Flatstart Training

Michael Beilig, Diane Hirschfeld, Oliver Jokisch, Uwe Koloska

Kontrastive Untersuchung zur Realisierung der Fokusakzente in gelesenen Äußerungen (am Beispiel der Sprachenpaarung L1 Russisch – L2 Deutsch)

Rainer Jäckel, Hussein Hussein

An investigation of the pronunciation of English words in German sms texts

Hongwei Ding, Oliver Jokisch

2010

On the Alignment of Prosodic Events

Hansjörg Mixdorff

Early Experiments on Prosody in Synthetic Speech

Rüdiger Hoffmann, Dieter Mehnert

In Search of Models — A Review of the Author’s Research over a Half Century

Hiroya Fujisaki

Shifting the Paradigm from Source-Filter-Modelling to Segmental-Suprasegmental Modelling of Speech.

Hartmut R. Pfitzinger

An Action-Based Concept for the Phonetic Annotation of Sign Language Gestures

Bernd J. Kröger, Jim Kannampuzha, Dominik Bauer, Peter Birkholz, Philippe Dreuw, Hermann Ney

Speech, Gaze and Head Motion in a Face-to-Face Collaborative Task

Sascha Fagel, Gerard Bailly

Maschinelle Klassifikation von Artikulationsbewegungen im Rahmen einer visuellen Artikulationsschulung für gehörlose und schwerhöriger Kinder

Ralf Winkler, Gunter Uhlmann, Gerd Schneider

Wirkung menschlicher Stimme auf die wahrgenommene Sympathie- Einfluss der Stimmanregung anhand von Laryngogrammen

Benjamin Weiss, Sebastian Möller, Tim Polzehl

Affektäußerungen in Sprachkorpora

Jürgen Trouvain

Das Prosodisch-Phonetische Annotationssystem PROPHANO

Sören Wittenberg, Oliver Jokisch

Accent Command Model. Parameter Alignment in Argentine Spanish Absolute Interrogatives

Jorge Gurlekian, Diego Evin, Hansjörg Mixdorff, Humberto Torres, Hartmut Pfitzinger

Using FO Contour Generation Process Model for Improved and Flexible Control of Prosodic Features in HMM-based Speech Synthesis

Keikichi Hirose, Keiko Ochi, Miaomiao Wang, Tatsuya Matsuda, Miaomiao Wen, Nobuaki Minematsu

Ein interdisziplinäres: Stimmkonzept

Katrin Hannappel, Nils Ülzmann, Hartmut R. Pfitzinger

Instrumental Evaluation of Synthesized Speech Quality

Sebastian Möller, Florian Hinterleitner

Acoustics vs. articulation in articulatory speech synthesis: One vocal tract target configuration has more than one sound

Eva Lasarcyk

Speech Conversion Using a Mixed-phase Cepstral Vocoder

Martin Vondra, Robert Vich

Erzeugung schneller Sprache mittels Unit Selection Sprachsynthese

Donata Moers, Petra Wagner, Bernd Möbius

Phoneme-to-phoneme alignment and conversion

Uwe D. Reichel, Raphael Winkelmann

Laufzeitoptimierte Geräuschreduktionsverfahren basierend auf overlap-save-Strukturen mit Projektionsfilternäherungen

Arthur Wolf, Bernd Iser, Gerhardt Schmidt

Enthallung und Trennung von Sprachsignalen mittels blinder adaptiver MIMO-Filterung

Herbert Buchner

Cortical Algorithm for Symbolic and Sub-symbolic Applications

Ronald Römer

Reducing the Complexity or the Delay of Adaptive Subband Filtering

Patrick Hannon, Mohamed Krini, Gerhard Schmidt, Arthur Wolf

Laufzeitmessung von gestörten akustischen Signalen mit Verfahren der Mustererkennung

Ulrich Kordon, Matthias Wolff, Steffen Kürbis

Entwicklung und Performance eines Sprachdialogsystems mit begrenzten Hardwareressourcen

Frank Duckhorn, Guntram Strecha, Matthias Wolff, Rüdiger Hoffmann

Herausforderungen an Sprachinterfaces für Kinder

Karina Matthes, Felix Claus, Horst-Udo Hain, Rico Petrick

Identifikation von Interaktivitätsmustern zur regelbasierten Usability- Evaluierung von Sprachdialogsystemen

Stefan Schmidt, Matthias Schulz, Martin Meister, Julian Stubbe, Mandy Töppel, Klaus-Peter Engelbrecht, Sebastian Möller

Akustisches und mobiles Front-End für ein Public Terminal

Thomas Fehér, Sören Wittenberg, Rüdiger Hoffmann

InproTK in Action: Open-Source Software for Building German-Speaking Incremental Spoken Dialogue Systems

Timo Baumann, Okko Buß, David Schlangen

Voice and Graphical User Interfaces: Design Issues

Tomáš Nestorovič

Improvements of Hidden Chunk Models

Harald Höge, Panji Setiawan

Evaluation of Automatic Speaker Recognition Approaches

Pavel Král, Václav Matoušek

N-Best Rescoring based on Intonation Prediction for a Spanish ASR System

Diego Evin, Jorge Gurlekian, Humberto Torres

Improving speech interaction in vehicles using context-aware information through an SCXML framework

Álvaro Sigüenza, José Luis Blanco, David Conejero, Luis Hernández

Schnelle Entwicklung von Sprachdialogen mit dem Framework GRAILS

Stephan Euler

Mobile Office and Entertainment System Based on Android

Felix Burkhardt, Martin Eckert, Julia Niemann, Frank Oberle, Thomas Scheerbarth, Stefan Seide, Jianshen Zhou

Mixed-Type-Multi-Class Audio Klassifikation und Segmentation für die Inhaltserfassung von Broadcast Medien

Katja Madany

Human Speech Model based on Information Separation

Nobuaki Minematsu

Pronunciation of German Syllable Codas of Mandarin Chinese Speakers

Hongwei Ding, Hansjörg Mixdorff, Oliver Jokisch

Development of a Computer-Aided Pronunciation Training System for Teaching Mandarin for German Learners — Pronunciation Errors

Hussein Hussein, Hansjörg Mixdorff, Hue San Do, Si Wei, Oianyong Gao, Shu Gong, Hongwei Ding, Guoping Hu

Computational Modeling of Timing Control and its Application to Objective Evaluation of the Second Language Proficiency

Yoshinori Sagisaka, Hiroaki Kato, Minoru Tsuzaki, Shizuka Nakamura, Chatchawarn Hansakunbuntheung

Pitch Pattern Recognition of Isolated Words for the Development of a Japanese Language Call System

Greg Short, Keikichi Hirose, Nobuaki Minematsu

2011

A survey of self-oscillating lumped-element models of the vocal folds

Peter Birkholz

Dual channel reduction of rapidly varying harmonic and random noise using a spot microphone

Florian Heese, Thomas Esch, Peter Vary

Evaluation of single- and dual-channel noise power spectral density estimation algorithms for mobile phones

Christian Herglotz, Marco Jeub, Christoph Nelke, Christophe Beaugeant, Peter Vary

The impact of correlated features in speech recognition

Harald Höge

Speechalyzer: a software tool to process speech data

Felix Burkhardt

Deeper insights into the role of Broca’s region in language processing by connectivity analysis

Stefan Heim, Simon B. Eickhoff

Prominenzbasierte Prosodieprädiktion für die Unit-Selection-Sprachsynthese

Andreas Windmann, Igor Jauk, Fabio Tamburini, Petra Wagner

Towards a better understanding of TTS Synthesis: Subjective quality and its instrumental assessment

Christoph Norrenbrock, Florian Hinterleitner, Ulrich Heute, Sebastian Möller

Predicting the quality of synthesized speech using reference-based prediction measures

Florian Hinterleitner, Steve Zabel, Sebastian Möller, Lutz Leutelt, Christoph Norrenbrock

Was soll(t)en wir mit Sprachdatenbanken anfangen?

Bernd Pompino-Marschall

Sex-specific differences in vowel undershoot. Consequences for the perception of clarity and tempo

Adrian P. Simpson

On the application of psychoacoustically-motivated dereverberation for recordings taken in the German parliament

Marco Jeub, Peter Vary

Quality of network based acoustic noise reduction

Matthias Pawig, Peter Vary

Near end listening enhancement considering thermal limit of mobile phone loudspeakers

Bastian Sauert, Peter Vary

The CoPaSul intonation model

Uwe D. Reichel

Performanzuntersuchungen zur Stimmkonvertierung

Oliver Jokisch, Hamurabi Gamboa Rosales

Die Lokalisation von sprachlichen und kognitiven Prozessen im fMRT Interferenzparadigma

Stefanie Abel

Development of automatic Amharic speech recognizer

Yitagessu Birhanu Gebremedhin, Rüdiger Hoffmann

The lexicon-syllabary model: Evidence from imaging studies

Cornelia Eckers, Stefan Heim, Bernd J. Kröger

Binaural wideband telephony using steganography

Bernd Geiser, Magnus Schäfer, Peter Vary

The computational architecture of Elija: a model of a young child that learns to pronounce

Ian S. Howard, Piers Messum

Comparison of Fujisaki-model parameters between German Learners and native speakers of Mandarin

Hussein Hussein, Hansjörg Mixdorff, Hue San Do, Marijo Mateljan, Qianyong Gao, Guoping Hu, Si Wei, Zhao Chao

Training einer sich selbst organisierenden Karte im neurobiologischen Sprachverarbeitungsmodell MSYL

Jim Kannampuzha, Cornelia Eckers, Bernd J. Kröger

Evaluierung der Leistungsfähigkeit von Spracherkennungssystemen in Geräten der Kommunikationstechnik

Andreas Kitzig, Hans-Günter Hirsch

Is there an otoacoustic fingerprint?

Peter Knopp

Endliche gewichtete Transduktoren als semantischer Träger

Christian Kölbl, Markus Huber, Günther Wirsching

Neurobiological interpretation of a quantitative target approximation model for speech actions

Bernd J. Kröger, Peter Birkholz, Jim Kannampuzha, Cornelia Eckers, Emily Kaufmann, Christiane Neuschaefer-Rube

Beyond vocal tract actions: speech prosody and co-verbal gesturing in face-to-face communication

Bernd J. Kröger, Peter Birkholz, Emily Kaufmann, Christiane Neuschaefer-Rube

A fast indexing method for shells of the gosset lattice

Hauke Krüger, Bernd Geiser, Peter Vary, Haiting Li, Deming Zhang

Combined analog/digital broadband feedback ANC for headsets

Hauke Krüger, Thomas Schumacher, Marco Jeub, Peter Vary

Schnell gesprochene Sprache als Einheiten-Auswahl-Inventar in der Unit-Selection-Sprachsynthese

Donata Moers

Robust continuous speech recognition through combination of invariant-feature based systems

Florian Müller, Alfred Mertins

A listening test environment for subjective assessment of speech and audio signal processing algorithms

Magnus Schäfer, Christopher Schnelling, Bernd Geiser, Peter Vary

Progress in animation of an EMA-controlled tongue model for acoustic-visual speech synthesis

Ingmar Steiner, Slim Ouni

Zur Wahrnehmung von manipuliertem Weinen als Lachen

Jürgen Trouvain

Wahrnehmungsdimensionen von Stimme und Sprechweise

Benjamin Weiss, Sebastian Möller

Gehörrichtige Geräuschanalyse nichtsprachlicher akustischer Signale in der Mustererkennung

Sören Wittenberg

Forensisch-phonetischer Stimmenvergleich

Angelika Braun

Vom Hören zum Verstehen: Sprach- und Signalverarbeitung in Hörgeräten und Cochlea-Implantat-Systemen

Wolfgang H. Döring

Tubenfunktionsprüfung mit Methoden der digitalen Sprachsignalverarbeitung

Aulis Telle, Peter Vary

Stimm-Messungen mit einem Beschleunigungssensor am Kehlkopf

Wolfgang Wokurek

Experimentelle Ansätze zur Schlagzeuganalyse in Musiksignalen

Stephan Hübler, Rüdiger Hoffmann

Zur Logik von Bestenlisten in der Dialogmodellierung

Günther Wirsching, Christian Kölbl, Markus Huber

Die Architektur artikulatorischer Pläne: Neurophonetische Evidenz

Wolfram Ziegler

Beschreibung von Analyse-Synthese-Systemen unter Verwendung von kaskadierten bidirektionalen HMMs

Ronald Römer

Modelling caregiver tutored development of pronunciation in a young child

Ian S. Howard, Piers Messum

Exemplarbasierte Sprachproduktion und Unit Selection-Synthese

Bernd Möbius

Wie relevant ist die Phonetik noch für die Sprachsynthese?

Petra Wagner

2012

Die rätselhafte Fähigkeit des Gehirns, Sprache ohne Hilfe von neuronalen Codes zu verarbeiten

Wolfgang Hilberg

Nichtsequentialität in der Sprachverarbeitung mit FST

Günther Wirsching

Benutzermodell zur Simulation von Interaktionen mit Sprachdialogsystemen basierend auf Aktivierung von Teil-Zielen

Klaus-Peter Engelbrecht

The Use of Conditional Gaussians for Hidden Chunk Models

Harald Höge

Automatische Zeichensetzung in Spracherkennungssystemen: Entscheidungsbaum und Sprachmodell im Vergleich

Heike Adel, Kevin Kilgour, Sebastian Stüker, Alex Waibel

Investigation of hierarchical classification for simultaneous gender and age recognition

Ingo Siegert, Ronald Böck, David Philippou-Hübner, Andreas Wendemuth

Continuous speech recognition using Correlation features and structured SVM probability output

Andreas Beschorner, Dietrich Klakow

Multi-condition Training and Adaptation for Noise Robust Speech Recognition

Ivan Kraljevski, Frank Duckhorn, Matthias Wolff, Rüdiger Hoffmann

Zum Einsatz von Elektroenzephalographie bei der Messung der Wahrnehmung gestörter Sprache

Sebastian Möller, Jan-Niklas Antons, Sebastian Arndt, Anne K. Porbadnigk, Robert Schleicher

A new artificial palate design for the optical measurement of tongue and lip movements

Peter Birkholz, Christiane Neuschaefer-Rube

How does the Brain recognize speech - Modelling using hierarchical recurrent neural networks

Stefan J. Kiebel, Burak I. Yildiz

Konfidenzberechnung für automatische Labels

Frank Duckhorn, Rüdiger Hoffmann

On the Use of Fujisaki Parameters for the Quality Prediction of Synthetic Speech

Florian Hinterleitner, Christoph Norrenbrock, Sebastian Möller

Zur Formulierung von Hidden-Markov-Modellen als endliche Transduktoren

Constanze Tschöpe, Matthias Wolff

Algorithmen zur Störgeräuschunterdrückung für differentielle Mikrofonanordnungen

Thomas Fehér, Rüdiger Hoffmann

Probabilistic induction of metrical trees for word stress assignment

Uwe D. Reichel

Postvokalische /r/ Realisierung in Erst- und Zweitsprache

Christiane Ulbrich, Horst Ulbrich

A Preliminary Investigation of Tense-Lax Contrast of German Vowels by Chinese Learners

Hongwei Ding, Oliver Jokisch

Hierarchische kognitive dynamische Systeme zur Sprach- und Signalverarbeitung

Matthias Wolff, Ronald Römer, Rüdiger Hoffmann

’Ja, mhm, ich verstehe Dich’ – Oszillator-basiertes Timing multimodaler Feedback-Signale in spontanen Dialogen

Petra Wagner, Benjamin Inden, Zofia Malisz, Ipke Wachsmuth

Entwicklung von Dialogstrategien zur Sprachbedienung von Web Transactions im Fahrzeug

Hansjörg Hofmann, Anna Silberstein, Ute Ehrlich, André Berton, Anja Naumann, Sebastian Möller

Qualitätssicherung im Linguatronic Entwicklungsprozess – Modellbasiertes Testen auf Basis formaler Beschreibung von Sprachdialogsystemen

Lars Lütze, Dr. Steffen Werner

Untersuchungen zur Güte der Simulation einer Spracheingabe im Freisprechmodus bei der Evaluierung von Spracherkennungssystemen

Andreas Kitzig, Hans-Günter Hirsch

Zum Stand der Technik im automatischen Erkennen von Kindersprache

Felix Claus, Rico Petrick, Horst-Udo Hain

Combining Mimic and Prosodic Analyses for User Disposition Classification

Ronald Böck, Kerstin Limbrecht, Ingo Siegert, Stefan Glüge, Steffen Walter, Andreas Wendemuth

Applying the speaking rate in a hierarchical classifier for emotion recognition from speech

David Philippou-Hübner, Ronald Böck, Andreas Wendemuth

Vergleich der Produktionsgeschwindigkeit von Laut- und Gebärdensprache

Jens Lindemann

Untersuchungen zum Cortikalen Algorithmus unter Verwendung von Bidirektionalen HMMs

Ronald Römer

Hidden Markov Model based Amharic Speech Synthesizer

Yitagessu Birhanu, Guntram Strecha, Rüdiger Hoffmann

Aspekte von Sympathie: Gesprächsstruktur und Gesprächsanteil

Benjamin Weiss, Katrin Schoenenberg

Semantic, Phonetic, and Phonological Knowledge in a Neurocomputational Model of Speech Acquisition

Cornelia Eckers, Bernd J. Kröger

Gestörte akustische Umgebungen und ihr Einfluss auf netzbasierte auditive Testverfahren

Christian Richter, Tobias Holfeld

Signalphonetische Untersuchung der Obstruentenfolgen an Wortfugen in gelesenen Äußerungen russischer und tschechischer Deutschlerner

Rainer Jäckel

Mutmaßungen über Kognition

Klaus Fellbaum

Petri Net Tranducers in Semantic Dialogue Modelling

Markus Huber, Robert Lorenz

FeVaRFiStTr - Algorithmische Kommutativität zwischen gewichteten Merkmal- Werte-Relationen und endlichen gewichteten Transduktoren in ihrer Funktion als semantische Träger

Niclas Geiger, Markus Huber, Christian Kölbl, Moritz Laudahn, Rupert Reutner-Hammelmeir, Frowin Ziegler

Semantische Modellierung von System-Benutzer-Interaktionen am Beispiel einer Home-Entertainment Steuerung

Kathleen Karnagel, Ronald Römer, Stephan Rogge, Jens Lindemann

Semantische Modellierung eines Virtual Reality Systems mit Gestensteuerung

Stephan Rogge, Ronald Römer, Christian Hentschel

A Pronunciation Tutoring System for Basque - First Development Steps

Igor Odriozola, Oliver Jokisch, Inma Hernáez, Rüdiger Hoffmann

Realisierung eines Smartphone-basierten auditiven Feedbacks zur unterstützenden Stotterbehandlung

Jürgen Hock, Stefan Feldes

Gut und günstig? Nutzung des Google Speech API in Sprachdialogsystemen

Stefan Schmidt

HMM-Based Mandarin Tone Recognition - Application in Computer-Aided Language Learning System for Mandarin

Hussein Hussein, Hansjörg Mixdorff, Yuan-Fu Liao, Rüdiger Hoffmann

Beurteilung von Metallblasinstrumenten auf der Basis messtechnisch gewonnener Merkmale

Gunter Ziegenhals

2013

Incremental Speech and Language Processing

David Schlangen

Using Affordances to shape the interaction in a hybrid spoken dialogue system

Timo Baumann, Maike Paetzel, Philipp Schlesinger, Wolfgang Menzel

Aufgabenmodellierung in der Simulation von Interaktionen mit Sprachdialogsystemen

Stefan Hillmann, Klaus-Peter Engelbrecht

Herausforderungen der kombinierten Verwendung von On-Board- und Off-Board- Sprachdialogsystemen in Telematikeinheiten im Automobil

Maria Schmidt, Steffen Werner, Tobias Heinroth

Semantische Anwendungsmodellierung und Nutzermodelle: Anforderungen an einen sprachlich zu bedienenden persönlichen Assistenten im dynamischen Systemumfeld

Sven Reichel, André Berton, Ute Ehrlich, Michael Weber

Perceptual quality dimensions of Text-to-Speech systems in audiobook reading tasks

Florian Hinterleitner, Christoph Norrenbrock, Sebastian Möller

Einatmungsgeräusche vor synthetisch erzeugten Sätzen: Eine Pilotstudie

Jürgen Trouvain, Bernd Möbius

Informationsstruktur in der Sprachsynthese: Früher Fokus und postfokale Gegebenheit

Frank Kügler, Bernadett Smolibocki, Manfred Stede, Sebastian Varges

How to learn proto speech patterns using a physiologically based vocal tract model

Bernd J. Kröger, Xi Chen, Cornelia Eckers, Stefan Heim

Contribution of timing patterns into perceived foreign accent

Leona Polyanskaya, Mikhail Ordin, Christiane Ulbrich

A preliminary investigation of German rhythms by Chinese learners

Hongwei Ding, Rainer Jäckel, Rüdiger Hoffmann

Modeling multi-modal factors in speech production with the context-sequence model

Daniel Duran, Jagoda Bruni, Grzegorz Dogil

Ein Beitrag zu den Natur- und geisteswissenschaftlichen Grundlagen kognitiver Systeme

Ronald Römer, Günther Wirsching, Matthias Wolff

Realising the Translation of Utterances into Meanings by Petri Net Transducers

Robert Lorenz, Markus Huber

Konstruktion von UMP-Transduktoren aus Wizard-of-Oz Daten

Markus Huber, Christian Kölbl, Robert Lorenz, Günther Wirsching

Elektromyographische Analyse von Sprech- und Schluckbewegungen

Peter Birkholz

Voice enabling the AutoScout24 Car Search App

Felix Burkhardt, Jianshen Zhou, Stefan Seide, Thomas Scheerbarth, Bernd Jäkel, Tilman Buchner

The speech action repository: Evidence from a single case neuroimaging study

Cornelia Eckers, Bernd J. Kröger, Stefan Heim

Phonetic analysis vs. dirty signals: Fixing the paradox

Tina John, Oliver Niebuhr, Gerhard Schmidt, Anne Theiß

Prospects of EPG and OPG sensor fusion in pursuit of a 3D real-time representation of the oral cavity

Simon Preuß, Christiane Neuschaefer-Rube, Peter Birkholz

TextGridTools: A TextGrid Parsing and Analysis Toolkit

Hendrik Buschmeier, Marcin Włodarczak

A dialect distance metric based on string and temporal alignment

Thomas Kisler, Uwe D. Reichel

Differences between speakers in audio- vs. visual classification of word prominence

Martin Heckmann

Cross-cultural recognition of auditive feedback with echo state networks

Anja K. Philippsen, Kai A. Mismahl, Britta Wrede, Yukie Nagai

Alignment between rigid head movements and prosodic landmarks

Angelika Hönemann, Hansjörg Mixdorff, Sascha Fagel

Progress in facial expression based affective speech translation

Zeeshan Ahmed, Ingmar Steiner, Éva Székely, Julie Carson-Berndsen

Subsymbol-Symbol-Transduktoren

Matthias Wolff, Constanze Tschöpe, Ronald Römer, Günther Wirsching

Anwendungen der akustischen Mustererkennung

Constanze Tschöpe, Matthias Wolff, Rüdiger Hoffmann

Phonetics and Phonology of Interaction

Petra Wagner

Prosodische Elemente vokaler Sympathie

Benjamin Weiss

Second-degree polynomial model of Mandarin Chinese Lexical Tone F0 Contours

Tomasz Kuczmarski, Danien Duran, Norbert Kordek, Jagoda Bruni

Parameterization of F0 register and discontinuity to predict prosodic boundary strength in Hungarian spontaneous speech

Uwe D. Reichel, Katalin Mády

Improved phoneme segmentation of German-accented English by means of lexicon and acoustic model adaptation

Maria Paola Bissiri, Ivan Kraljevski, Rüdiger Hoffmann

Text independent speaker identification with coded speech

Ivan Kraljevski, Maria Paola Bissiri, Rüdiger Hoffmann

Predictability of the effects of phoneme merging on speech recognition performance by quantifying phoneme relations

Lia Saki Bucar Shigemori, Uwe Reichel

Comparison of HMMs and HCMs

Harald Höge

2014

Wozu eigentlich Schall? Vom Hören zur akustischen Gestaltung der Welt.

Friedrich E. Blutner

Was kommt nach dem Schall? - Experimente und Modalanalysen zum Hören

Marcus Neudert, Matthias Bornitz, Thomas Beleites, Thomas Zahnert

Building Segments with Chunks

Harald Höge

Ein Multiskalen Analyse-System unter Verwendung von kaskadierten bidirektionalen Hidden Markov Modellen

Ronald Römer

Tuning Sphinx to outperform Google’s speech recognition API

Patrick Lange, David Suendermann-Oeft

Language-independent grapheme-phoneme conversion and word stress assignment as a web service

Uwe D. Reichel, Thomas Kisler

Studie zur Anwendbarkeit schneller Sprachsynthese in Sprachdialogsystemen

Klaus-Peter Engelbrecht, Arne Denneler, Cliford Yangmia, Benjamin Weiss

Arabic text to speech synthesis system

Aymen El Kadhi, Guntram Strecha, Rüdiger Hoffmann, Hamid Amiri

Semantisches Taskmodell für Dialoge mit Taskwechsel

Sven Reichel, Philipp Pfarherr, Ute Ehrlich, André Berton, Michael Weber

Evaluation von Nutzersimulationen anhand eines Ähnlichkeitsmaßes für Dialogkorpora

Stefan Hillmann

Formale Subtextanalyse – Deduktion bedürfnisorientierter Propositionen aus narrativen Äußerungen

Peter Klimczak

Die kognitive Heizung

Peter Klimczak, Matthias Wolff, Jens Lindemann, C. Petersen, Ronald Romer, T. Zoglauer

Konstruktion einer mikrolokalen Grammatik mit OpenFST am Beispiel einer Home-Entertainment-Anwendung

Dennis Ritter , Günther Wirsching

Semantische Dekodierung von Sprachsignalen am Beispiel einer Mikrofonfeldsteuerung

Günther Wirsching, Matthias Wolff

Constructing Petri net transducers with PNTooL

Markus Huber, Robert Lorenz, Daniel Straßner

Semantische Verarbeitung von Gebärdensprache in intelligenten hierarchischen Sprachdialogsystemen

Jens Lindemann

Towards non-invasive velum state detection during speaking using high-frequency acoustic chirps

Peter Birkholz, Michael Schutte, Simon Preuß, Christiane Neuschaefer-Rube

Ein OPG-gesteuertes Serious Game zur Unterstützung mundmotorischer Übungen

Simon Preuß, Cornelia Eckers, Peter Birkholz, Christiane Neuschaefer-Rube

SOM’s and GSOM’s in biologically inspired models of speech processing

Bernd J. Kröger, Mengxue Cao

Modeling speech processing using NENGO: First steps

Bernd J. Kröger

Quality assessment in pronunciation trainer for speech disorder therapy

Ivan Kraljevski, R. Kompe, Rainer Jäckel, F. Kurnot, M. Rudolph, D. Hirschfeld, Rüdiger Hoffmann

Untersuchung segmentaler und suprasegmentaler Charakteristiken des Sprechsignals bei Morbus Parkinson

Rainer Jäckel, Guntram Strecha, Rüdiger Hoffmann, Bernd J. Kröger

Episodische Dysarthrie bei Hirnstammkompression - Akustisch-phonetische und auditiv-perzeptuelle Analyse eines Einzelfalls

Helena Kukla, Nina Kleiser, Bernd J. Kröger

Individuelle Ausprägung von Atmungspausen in der Mutterund in der Fremdsprache als Anzeichen kognitiver Belastung

Jürgen Trouvain, Bernd Möbius

HMM-based classification of glottalization phenomena in German-accented English

Maria Paola Bissiri, Ivan Kraljevski, Rüdiger Hoffmann

Zur Evaluierung von Intonationskonturen beim Fremdsprachenerwerb

Tristan Langenberg, Oliver Jokisch

Application of EmotionML

Felix Burkhardt, Christian Becker-Asano, Edmon Begoli, Roddy Cowie, Gerhard Fobe, Patrick Gebhard, Abe Kazemzadeh, Ingmar Steiner

The prosody of motivation: First results from an indoor cycling scenario

Lisa V. Skutella, Luise Süssenbach, Karola Pitsch, Petra Wagner

Significance of rhythmic duration patterns in German read corpus using cluster analysis

Zaheer Hussain

On the direct measurement and interactive 3D rendering of dummy-head directional characteristics using polar coordinates

György Wersényi, József Répás, Michael Graf

Sprecherlokalisierung mit einem 3D-Mikrofonfeld

Martin Birth

Anmerkungen zu den Begriffen „Verständlichkeit“ und „Verstehbarkeit“ bei der Sprachqualitätsmessung

Klaus Fellbaum, Dirk Höpfner

Eigenschaften von E-Gitarren - Mythen, Methoden, Merkmale

Gunter Ziegenhals

Transkription von Schlagzeugaufnahmen unter Verwendung des UASR-Systems

Stephan Hübler, Johannes Völkner, Rüdiger Hoffmann

2015

Phonetik und Sprachsignalverarbeitung

Hans G. Tillmann

Referenz im Diskurs. Theoretische und methodische Ansätze

Christian Lehmann

Awendungsorientierter Einsatz von Spracherkennung und Signalverarbeitung. Konkrete Projekte, Projektskizzen und Ideen

Franz Stieger

Sprachbedienung im Automobil

Gerd Gruchalski

A Phone-oriented Segment Model of the Human Cortex - a Hypothesis

Harald Höge

Eine webbasierte Experimentierumgebung mit Sprachdatenbank und Spracherkennung

Stephan Euler

Language Model Adaptation for Transcription of Banking Protocols

Ivan Kraljevski, Diane Hirschfeld

Textabhängige Sprechererkennung

Peter Geßler, Matthias Wolff

Wiedererkennbarkeit von Sprechern bei schmal- und breitbandiger Telefonübertragung

Sebastian Möller, Laura Fernández Gallardo, Michael Wagner

On the use of automatic speech recognizers for the quality and intelligibility prediction of synthetic speech

Florian Hinterleitner, Steffen Zander, Klaus-Peter Engelbrecht, Sebastian Möller

Experimente zur Wahrnehmung gezielt degradierter synthetischer Sprache

Eva Lasarcyk, Heiner Drenhaus, Bernd Möbius

Evaluating Commercial and Open Source Text-to-Speech Synthesis Considering Specifc Problem Classes

Felix Burkhardt

Modular Synthesis of Dis uencies for Conversational Speech Systems

Simon Betz, Petra Wagner, David Schlangen

Adaptive Speech Synthesis in a Cognitive Robotic Service Apartment

Angelika Hönemann, Petra Wagner

Pitch elbow detection

Uwe D. Reichel, Nele Salveste

Visual Feedback Tool for German Vowel Production

Patrick Carroll, Jürgen Trouvain, Frank Zimmerer

An Investigation of English Prosody Produced by Chinese Speakers

Hongwei Ding, Rüdiger Hoffmann, Daniel Hirst

Akustische Korrelate von Sympathieurteilen bei Hörern gleichen Geschlechts

Benjamin Weiss

Ein Datenset zur Untersuchung emotionaler Sprache in Kundenbindungsdialogen

Ingo Siegert, David Philippou-Hübner, Michael Tornow, Ralph Heinemann, Andreas Wendemuth, Kerstin Ohnemus, Sarah Fischer, Gerald Schreiber

Fusion von Klassifikationsmodellen zur automatischen Erkennung von Stimmeigenschaften in der Qualitätsbewertung von Callcenter-Gesprächen

Mathias Walther, Taieb Mellouli, Oliver Jokisch

Usability-Untersuchung der natürlichsprachlichen Bedienung eines Smart TV

Stefan Hillmann

Interpretation von Gebärdenspracheingaben am Beispiel einer Home-Entertainment-Steuerung

Jens Lindemann

Konzeption eines Kognitiven Systems für den experimentellen Einsatz in Forschung und Lehre

Ronald Römer, Matthias Wolff

Modellierung von Bewältigungsverhalten mit Merkmal-Werte-Relationen

Matthias Wolff, Werner Meyer, Ronald Römer

Das Labor für kognitive Systeme an der BTU Cottbus-Senftenberg

Christian Richter, Jens Lindemann, Ronald Römer, Matthias Wolff

Fortschritte in der elektro-optischen Stomatographie

Simon Preuß, Peter Birkholz

Smartphone-basierte Bewegungsanalyse im Fahrzeug

Tristan Langenberg, Oliver Jokisch

In uence of synthetically varied signal parameters of impulsive vehicle sounds on perceived quality

Marius Höchstetter, Philipp Seifert, Oliver Jokisch, Jesko L. Verhey, Ulrich Gabbert

Automatic differentiation of form-function-relations of the discourse particle "hm" in a naturalistic human-computer interaction

Alicia Flores Lotz, Ingo Siegert, Andreas Wendemuth

Modellierung des Semantik-Syntax Grenzübergangs kognitiver Systeme am Beispiel des "Mouse-Maze"-Problems

Markus Huber, Ronald Römer

2016

Motivation und Intelligenz

Dietrich Dörner

Informationsdarstellung nach den Gesetzen der Quantenmechanik und –logik

Ingo Schmitt

Ontologie und Semantik in der Auswertung von Texten im forensischen Umfeld

Dirk Labudde

Modeling Motor Planning in Speech Production Using the Neural Engineering Framework

Bernd J. Kröger, Trevor Bekolay, Peter Blouw

Towards a Mechanical Vocal Apparatus for Vowel Production

Ian S. Howard

GlottalImageExplorer – An Open Source Tool for Glottis Segmentation in Endoscopic High-Speed Videos of the Vocal Folds

Peter Birkholz

Untersuchung elastischer Materialien für künstliche Stimmlippen

Lin Wang, Simon Preuß, Peter Birkholz

The Statistics and Phone Error Rates of Bark-Features

Harald Höge

QUARK: Architecture for a Question Answering Machine

Felix Burkhardt

Spoken Language Understanding in Embedded Systems

Karl Weilhammer, Prince Kumar, Volker Springer, Dominique Massonie

Evaluierung von lexikalischer Adaption bei Sprachdialogen im Fahrzeug

Jakob Landesberger, Ute Ehrlich, André Berton

Erzeugung von Lautsequenzen für unbekannte Textsegmente mit Hilfe eines statistischen Ansatzes

Alexander Micheel, Hans-Günter Hirsch

Automatische Klassifikation des Ersteindrucks der Gesprächswahrnehmung bei ungeschulten Hörern

Mathias Walther, Frances Theres Beier, Taieb Mellouli, Baldur Neuber

Ein Beitrag zur Gedankengeometrie kognitiver Systeme

Ronald Römer, Markus Huber, Günther Wirsching

Multimodal Information Processing: The Ticket Purchase – a Demonstration Scenario of the SFB/TRR-62

Ingo Siegert, Stephan Reuter, Felix Schüssel, Georg Layher, Thilo Hörnle, Sascha Meudt, Andreas Wendemuth

Semantische Interpretation und Artikulation mit Äußerungs-Bedeutungs-Transduktoren

Jens Lindemann

WoOF: Ein Framework für Wizard of Oz Experimente

Markus Huber, Werner Meyer, Kati Nowack, Peter Geßler

Disfluent Lengthening in Spontaneous Speech

Simon Betz, Petra Wagner

F0 Declination and Speech Planning in Face to Face Dialogues

Susanne Fuchs, Uwe D. Reichel, Amélie Rochet-Capellan

How Prominence and Prosodic Phrasing Interact

Uwe D. Reichel, Katalin Mády, Felicitas Kleber

Characterization and Prediction of Dialogue Acts Using Prosodic Features

Katharina Mittelhammer, Uwe D. Reichel

Are we all Disfluent in our own Special Way and Should Dialogue Systems Also be?

Simon Betz, Soledad López Gambino

On the Assessment of Computer-Assisted Pronunciation Training Tools

Jürgen Trouvain, Jeanin Jügler, Yves Laprie

Speech Corpus Creation for Automatic Analysis of Phonetic Convergence

Grazyna Demenko, Jolanta Bachan, Agnieszka Wagner, Piotr Wyroslak

A Preliminary Study on the Inter-Lexical Pauses in L2 English Read by Chinese Students

Hongwei Ding, Rainer Jäckel, Rüdiger Hoffmann

Sprechtempo und Reduktion im Deutschen (SpuRD)

Matthias Hahn, Beat Siebenhaar

Zum Effekt von Tempo, Tonhöhe und Sprecherformant auf Sympathiebewertungen: Ein Resyntheseexperiment

Christoph Karnop, Benjamin Weiss

Evaluating Acoustic, Textual and Grammar Features for Alcohol Classification

Felix Neutatz, Dennis Schmidt, Moritz Teckenbrock, David Suendermann-Oeft

Measuring the Impact of Audio Compression on the Spectral Quality of Speech Data

Ingo Siegert, Alicia Flores Lotz, Linh Linda Duong, Andreas Wendemuth

Verhaltensanalyse von Einplatinencomputern beim Transcoding von Echtzeit-Audiodaten

Martin Meszaros, Michael Maruschke

Entwicklung einer universellen Audio- und Datenschnittstelle zur Sprachqualitätsmessung in digitalen Funknetzen

Enrico Lösch, Andreas Zimmermann, Alexander Schenk, Oliver Jokisch

Audio and Speech Quality Survey of the Opus Codec in Web Real-Time Communication

Oliver Jokisch, Michael Maruschke, Martin Meszaros, Viktor Iaroshenko

Extraktion und Vergleich musikalischer Rhythmen aus Aufnahmen von Klanghölzern

Günther Wirsching, Carolin Straub

Acoustic Event Classification for Ambient Assisted Living and Healthcare Environments

Hussein Hussein, Marc Ritter, Robert Manthey, Jan Schloßhauer, Etienne Fabian, Manuel Heinzig

Berührungslose Messung von Vitalparametern des Herzens

Kristian Kroschel, Martin Ruckhäberle

Sensorbasierte Bewegungsanalyse im Fahrzeug – Teil 2: Objektklassifikation mit maschinellem Lernen

Tristan Langenberg, Oliver Jokisch, Tilo Strutz

2017

Audio Compression and its Impact on Emotion Recognition in Affective Computing

Alicia Flores Lotz, Ingo Siegert, Michael Maruschke, Andreas Wendemuth

Manipulations of F0 contours in affective speech analysis

Magdalena Oleskowicz-Popiel, Jolanta Bachan

ikannotate2 – A Tool Supporting Annotation of Emotions in Audio- Visual Data

Ingo Siegert, Andreas Wendemuth

Robotic actuation of a 2D mechanical vocal tract

Ian S. Howard

Phonetische und korpus-linguistische Methoden bei der Analyse vokaler Kommunikation von freilebenden Schimpansen im Taï National Forest

Sven Grawunder, Natalie T. Uomini, Catherine Crockford

Vokaltraktmodelle im 18. Jahrhundert: Kempelen vs. Kratzenstein

Fabian Brackhane

An articulatory model of the complete vocal tract derived from medical images

Yves Laprie

An Improved Thresholding Function and Sparse Subspace decomposition for Speech Enhancement and its Application to Speech Recognition

Mohamed anouar Ben messaoud, Aïcha Bouzid

Herstellung und Charakterisierung künstlicher Stimmlippen aus Silikonkautschuk

Peter Birkholz, Lin Wang

Complex Emotions - The Simultaneous Simulation of Emotion- Related States In Synthesized Speech

Felix Burkhardt, Benjamin Weiss

Annotation specifications of a dialogue corpus for modelling phonetic convergence in technical systems

Grazyna Demenko, Jolanta Bachan

Prosodic Correlates of Voice Preference in Mandarin Chinese and German: A Cross-linguistic Comparison

Hongwei Ding, Rüdiger Hoffmann, Oliver Jokisch

Akustische Korrelate wahrgenommener Persönlichkeitsmerkmale und Stimmattraktivität

Daniel Duran, Natalie Lewandowski, Jagoda Bruni, Antje Schweitzer

Interacting with Robots - Tooling and Framework for Advanced Speech User Interfaces

Christian Hacker, Timo Sowa, Karl Weilhammer, Volker Springer, Dominique Massonie, Thomas Ranzenberger, Florian Gallwitz

Amplitude Envelope Kinematics of Speech Signal: Parameter Extraction and Applications

Lei He, Volker Dellwo

Quantifying the Benefits of Speech Recognition for an Air Traffic Management Application

Hartmut Helmke, Youssef Oualil, Marc Schulder

Little Drop of Mulligatawny Soup, Miss Sophie? Automatic Speech Understanding provided by Petri Nets

Markus Huber, Ronald Römer, Matthias Wolff

Enhancing the Objectivity of Interactive Formant Estimation: Introducing Euclidean Distance Measure and Numerical Conditions for Numbers and Frequency Ranges of Formants

Thayabaran Kathiresan, Dieter Maurer, Heidy Suter, Volker Dellwo:

Qualitative Evaluation and Error Analysis of Phonetic Segmentation

Arif Khan, Ingmar Steiner

A Head-Mounted Camera System for the Measurement of Lip Protrusion and Opening during Speech Production

Fabian Klause, Simon Stone, Peter Birkholz

Uprooting MaryTTS: Agile Processing and Voicebuilding

Sébastien Le Maguer, Ingmar Steiner

DevOps Manifesto for Speech Corpus Management

Ingmar Steiner

Speech Synthesis Evaluation: Realizing a Social Turn

Petra Wagner, Simon Betz

Perzeption von Sprechgeschwindigkeit und der (nicht nachgewiesene) Einfluss von Surprisal

Frank Zimmerer, Bistra Andreeva, Bernd Möbius, Zofia Malisz, Emmanuel Ferragne, François Pellegrino, Erika Brandt

Phone mapping and prosodic transfer in speech synthesis of similar dialect pairs

Michael Pucher, Carina Lozo, Sylvia Moosmüller

Developing new language tools for MaryTTS: the case of Luxembourgish

Ingmar Steiner, Sébastien Le Maguer, Judith Manzoni, Peter Gilles, Jürgen Trouvain

Regionale Variation in der deutschen Standardaussprache

Stefan Kleiner

First step Towards Enhancing Word Embeddings with Pitch Accent Features for DNN-based Slot Filling on Recognized Text

Sabrina Stehwien, Ngoc Thang Vu

Improving Phoneme Set Discovery for Documenting Unwritten Languages

Markus Müller, Jörg Franke, Sebastian Stüker, Alex Waibe

Long-range language modelling

Dietrich Klakow

Speaker-Group Specific Acoustic Differences in Consecutive Stages of Spoken Interaction

Ronald Böck, Olga Egorow, Andreas Wendemuth

Acoustic Source Localization in Home Environments - The Effect of Microphone Array Geometry (Work in Progress)

Timon Zietlow, Hussein Hussein, Danny Kowerko

Metalogue – Multiperspective Multimodal Dialogue

Jan Alexandersson

Ein Beitrag zur Formalisierung Finaler Systeme

Peter Klimczak, Ronald Römer, Matthias Wolff

Alex: An Artificial Conversational Agent for Students at the TU Berlin

Thilo Michael, Stefan Hillmann, Benjamin Weiss

Computation of L2 Speech Rhythm Based on Duration and Fundamental Frequency

Elisa Pellegrino, Lei He, Volker Dellwo

Investigating Phonetic Convergence in a Shadowing Experiment with Synthetic Stimuli

Eran Raveh, Iona Gessinger, Sébastien Le Maguer, Bernd Möbius, Ingmar Steiner

Unsupervised extraction of prosodic structure

Uwe D. Reichel

Semantische Repräsentation strukturierter Objekte im Hilbertraum und deren Verarbeitung nach quantenmechanischen Formalismen

Ingo Schmitt, Ronald Römer, Günther Wirsching, Matthias Wolff

Real-time manipulation of the F0-contour in synthetic speech using the Fujisaki model

Simon Stone, Konrad Schulze, Peter Steiner, Peter Birkholz

Towards the measurement of the Actor’s Formant in female voices

Sanya Tayal, Simon Stone, Peter Birkholz

Classification of Environmental Sounds for Future Hearing Aid Applications

Jürgen Tchorz, Simone Wollermann, Hendrik Husstedt

Surround Sound Processed by Opus Codec: A Perceptual Quality Assessment

Franziska Trojahn, Martin Meszaros, Michael Maruschke, Oliver Jokisch

Speaking rate variation and the interaction between hierarchical rhythmic levels

Agnieszka Wagner, Jolanta Bachan

Studying vocal social attractiveness by re-synthesis – results from two student projects applying acoustic morphing with Tandem- Straight

Benjamin Weiss, Anabell Hacker, Cleopatra Moshona, Frederic Rudawski, Matthias Ruhland

Gesture-based Articulatory Text to Speech Synthesis

Benjamin Weitz, Ingmar Steiner, Peter Birkholz

Nutzerzentrierter Entwurf von Multimodalen Bedienkonzepten

Ines Wendler, Andreas Jatho, Ivan Kraljevski, Martin Wenzel

A computer-assisted vowel trainer for the German language

Jeanin Jügler, Frank Zimmerer

Refinement Methods as Preprocessing or Postprocessing for Short- Term Spectra Analysis

Mohammed Krini

Formallogische Analysen des operanten Konditionierens

Peter Klimczak, Günther Wirsching

Human Feature Extraction – The Role of the Articulatory Rhythm

Harald Höge

Ein Drucksensor für (labiale) Plosive

Wolfgang Wokurek

Berührungslose Bestimmung der Herz- und Atmungsfrequenz

Kristian Kroschel, Jürgen Metzler

Biosignal-based spoken communication

Tanja Schultz

2018

The Mobile Cognitive Assistant: Bridging the Gap between In-Car and Outside-the-car Experiences

Dr. Stefan Ortmanns, Dr. Udo Haiber

Automatic Equalization for In-Car Communication Systems

Philipp Bulling, Klaus Linhard, Arthur Wolf, Gerhard Schmidt

Energy-Decay Based Postfilter for ICC Systems with Feedback Cancellation

Marco Gimm, Philipp Bulling, Gerhard Schmidt

On the relationship between instantaneous frequency and pitch in speech signals

Zied Mnasri, Hamid Amiri

Enhancing Multilingual Graphemic RNN based ASR Systems Using Phone Information

Markus Müller, Sebastian Stüker, Alex Waibel

Recent Improvements to Neural Network Based Acoustic Modeling in the EML Real-Time Transcription Platform

Volker Fischer, Omid Ghahabi, Siegfried Kunzmann

DNN Online Adaptation for Automatic Speech Recognition

Xinwei Li, Yue Pan, Matthew Gibson, Puming Zhan

Using Elementary Articulatory Gestures as Phonetic Units for Speech Recognition

Harald Höge

Evaluation of Different Excitation Generation Algorithms for Artificial Bandwidth Extension

Jonas Sautter, Friedrich Faubel, Markus Buck, Gerhard Schmidt

Unsupervised Neural-Network Based Vocal Tract Length Normalization

Philip Harding, Matthew Gibson

Multi-condition Deep Neural Network Training

Matthew Gibson, Christian Plahl, Puming Zhan, Gary Cook

A Robust Voice Activity Detection for Real-Time Automatic Speech Recognition

Omid Ghahabi, Wei Zhou, Volker Fischer

Ein Vorschlag für ein Webangebot zur Geschichte der Automatischen Spracherkennung

Stephan Euler

Zeichensatz-Erweiterung zur phonetischen Transkription pathologischer Sprache

Catharina Stille, Bernd J. Kröger

Voice Preference in German: A Cross-linguistic Comparison of Native and Chinese Listeners

Hongwei Ding, Rüdiger Hoffmann, Oliver Jokisch

Acoustic Addressee-Detection - Analysing the Impact of Age, Sex and Technical Knowledge

Ingo Siegert, Tang Shuran, Alicia Flores Lotz

Explorative Untersuchung von Multi-Intents in Sprachdialogsystemen

Jakob Landesberger, Daniel Kornmüller, Ute Ehrlich

Agenten in höheren Sphären - Quantenmechanische Situationsmodellierung kognitiver Systeme am Beispiel des Mouse-Maze-Problems

Markus Huber, Ronald Römer

Realisation of an Audio & Video Laboratory for Precise Object Localization and Tracking

Robert Manthey, Hussein Hussein, René Erler, Richard Siegel, Danny Kowerko

Towards a Speaking Style-Adaptive Assistant for Task-Oriented Applications

Maria Schmidt, Patricia Braunger

Simulation von Nutzerverhalten bei der Interaktion mit Sprachdialogsystemen mittels Künstlicher Neuronaler Netzwerke

Stefan Hillmann, Benjamin Weiss, Thilo Michael, Sebastian Möller

Untersuchung der kognitiven Beanspruchung durch Sprachassistenzsysteme

Daniel Duran, Natalie Lewandowski

Der Fockraum als Labyrinth: Wissensrepräsentation und Problemlösungen am Beispiel des Mouse-Maze-Problems

Peter beim Graben, Markus Huber, Ronald Römer, Ingo Schmitt, Matthias Wolff

Conversation modelling for chatbots: current approaches and future directions

Michael McTear

Kontinuierliche Schätzung von Sprechgeschwindigkeit mit einem Rekurrenten Neuronalen Netzwerk

Benjamin Weiss, Thilo Michael, Stefan Hillmann

Recognizing Modern Sound Poetry with LSTM Networks

Burkhard Meyer-Sickendiek, Hussein Hussein, Timo Baumann

Towards a speaker localization from spontaneous speech: north-south classification for speakers of contemporary German

Thomas Kisler, Florian Schiel

Emotion Recognition from Disturbed Speech - Towards Affective Computing in Real-World In-Car Environments

Alicia Flores Lotz, Fabian Faller, Ingo Siegert, Andreas Wendemuth

The Effect of Emotional Speech on Relative Speaker Discrimination

Juliane Höbel-Müller, Ronald Böck, Andreas Wendemuth

Influence of Age, Gender and Sample Duration on the Charisma Assessment of German Speakers

Oliver Jokisch, Viktor Iaroshenko, Michael Maruschke, Hongwei Ding

Testing speech perception today and tomorrow: serious computer games as perception tests

Natalie Lewandowski, Daniel Duran

Multimodal Affect Classification Using Deep Neural Networks

Friedhelm Schwenker

Acoustic Detection of Consecutive Stages of Spoken Interaction Based on Speaker-Group Specific Features

Ronald Böck, Olga Egorow, Andreas Wendemuth

Development of a Natural Language Speech Dialogue System for an AR-based, Adaptive Mobility Agent

Ivan Kraljevski, Marion Fischer, Aleksandar Gjoreski, Diane Hirschfeld

Dodging the Question in Competitive Spoken Dialogs: Semantic and Prosodic Characteristics

Uwe D. Reichel, Piroska Lendvai

Towards Natural Spoken Interaction with Artificial Intelligent Systems

Stefan Ultes

The Dragon Drive Innovation Showcase: Advancing the State-of-the-Art in Automotive Assistants

Julien Villemure, Peter Yeh, Robert Policano, Michael Kaisser, Rainer Gruhn

A Toolkit for 3D-Gesture and Speech Dialog in Automotive Environments

Timo Sowa, Alexander Richter, Dietmar Fey

Integration of a Kaldi Speech Recognizer into a Speech Dialog System for Automotive Infotainment Applications

Thomas Ranzenberger, Christian Hacker, Florian Gallwitz

Verhaltenssteuerung einer universellen kognitiven Benutzerschnittstelle anhand einer Heizungssteuerung

Werner Meyer, Markus Huber, Matthias Wolff

In-Car (Voice) Communication: Problems, Solutions, and Challenges

Gerhard Schmidt

Contactless Measurement of the Respiration Frequency by Vibrometry

Kristian Kroschel, Jürgen Metzler

Towards combined force and distance sensing using only optical sensors to aid in stroke rehabilitation

Christoph Wagner, Simon Stone, Peter Birkholz

Piano Transcriber - A Note-based Approach for Multipitch Tracking

Peter Steiner, Simon Stone, Peter Birkholz

Zu Mustern der Pausengestaltung in natürlicher und synthetischer Lesesprache

Jürgen Trouvain, Bernd Möbius

Ironic Speech - Evaluating Acoustic Correlates by Means of Speech Synthesis

Felix Burkhardt, Alexandra Steinhilber, Benjamin Weiss

Using state feedback to control an articulatory synthesizer

Ian S. Howard, Peter Birkholz

Optimierung der Numerik eines linearen Gleichungssystems für die Simulation des Schallfeldes im Vokaltrakt

Johann August Marwitz, Simon Stone, Peter Birkholz

2019

50 years Institute of Acoustics and Speech Communication – 30 years Conference Electronic Speech Signal Processing – 20 years Historic Acoustic-Phonetic Collection

Rüdiger Hoffmann

Investigation of densely connected convolutional networks with domain adversarial learning for noise robust speech recognition

Chia Yu Li, Ngoc Thang Vu

Convolutional neural networks can learn duration for detecting pitch accents and lexical stress

Sabrina Stehwien, Antje Schweitzer, Ngoc Thang Vu

Perception of German tense and lax vowel contrast by Chinese learners

Yingmin Gao, Hongwei Ding, Peter Birkholz, Rainer Jäckel, Yi Lin

Silent speech interfaces for speech restoration: current status and future challenges

José Andrés González López

Semi-automatische Generierung und Reinforcement Learning basiertes Training eines Dialogmanagers

Stefan Hillmann, Klaus-Peter Engelbrecht, Benjamin Weiss

Comparing phonetic changes in computer-directed and human-directed speech

Eran Raveh, Ingmar Steiner, Ingo Siegert, Iona Gessinger, Bernd Möbius

Analysis and categorization of corrections in multilingual spoken dialogue system

Ivan Kraljevski, Diane Hirschfeld

Speech and voice identity recognition in the human brain

Katharina von Kriegstein

Lernen durch Differenz. Zur logisch-mathematischen Struktur maschinellen Lernens

Peter Klimczak, Günther Wirsching, Matthias Wolff

Extraction of the Ɵ- and ɤ-cycles active in human speech processing from an articulatory speech database

Harald Höge

Bidirektionale Utterance-Meaning-Transducer für Zahlworte durch kompositionale minimalistische Grammatiken

Peter beim Graben, Werner Meyer, Ronald Römer, Matthias Wolff

In Articulation for Diversity

Korin Richmond

Comparison of different methods for the voiced excitation of physical vocal tract models

Peter Birkholz, Simon Stone, Steffen Kürbis

Resynthesizing the GECO speech corpus with VocalTractLab

Konstantin Sering, Niels Stehwien, Yingming Gao, Martin V. Butz, Harald Baayen

How should Pepper sound - Preliminary investigations on robot vocalizations

Felix Burkhardt, Milenko Saponja, Julian Sessner, Benjamin Weiss

Sprache von Produktgeräuschen – Mensch-Produkt Interaktion

Ercan Altinsoy

Influence of speech activity on vibrometer signals to extract vital parameters of humans

Kristian Kroschel, Jürgen Metzler

Schnelle Regelung eines monolithischen vollimplantierbaren Hörgeräts

Till Moritz Eßinger, Martin Koch, Matthias Bornitz, Hannes Seidler, Marcus Neudert, Thomas Zahnert

The restaurant booking corpus – content-identical comparative human-human and humancomputer simulated telephone conversations

Ingo Siegert, Jannik Nietzold, Ralph Heinemann, Andreas Wendemuth

ReTiCo: An open-source framework for modeling real-time conversations in spoken dialogue systems

Thilo Michael, Sebastian Möller

Segmenting multi-intent queries for spoken language understanding

Rohan Shet, Elena Davcheva, Christian Uhle

Exploration and assessment of proactive use cases for an in-car voice assistant

Maria Schmidt, Daniela Stier, Steffen Werner, Wolfgang Minker

Analysis of the influence of different room acoustics on acoustic emotion features

Juliane Höbel-Müller, Ingo Siegert, Ralph Heinemann, Alicia Flores Requardt, Michael Tornow, Andreas Wendemuth

Vergleich verschiedener Machine-Learning Ansätze zur kontinuierlichen Schätzung von perzeptivem Sprechtempo

Benjamin Weiss, Thilo Michael, Uwe Reichel, Oliver Pauly

IMS-speech: A speech to text tool

Pavel Denisov, Ngoc Thang Vu

Schätzung der spektralen Einhüllenden – Ein Vergleich von tiefen neuronalen Netzen und Codebüchern

Christopher Seitz, Mohammed Krini

Entscheidungstheoretische Modellierung der konsummatorischen Endhandlung – Vergleich von klassischen und quantenmechanischen Ansätzen

Ronald Römer, Peter beim Graben, Matthias Wolff

Multimodal speech segmentation using gaze data and spectrogram image features

Arif Khan, Ingmar Steiner

Design and deployment of multilingual industrial voice control applications

Ivan Kraljevski, M. Pohl, A. Gjoreski, U. Koloska, J. Wöhl, M. Wenzel, D. Hirschfeld

Drone sounds and environmental signals – a first review

Oliver Jokisch, Dominik Fischer

Surface stickiness and waviness of two-layer silicone structures for synthetic vocal folds

Falk Gabriel, Patrick Häsner, Eike Dohmen, Dmitry Borin, Peter Birkholz

A toolkit for nested multi-turn speech dialog in automotive environments

Timo Sowa, Soyuj Kumar Sahoo

Modell einer Frauenstimme für die artikulatorische Sprachsynthese mit VocalTractLab

Susanne Drechsel, Yingming Gao, Jens Frahm, Peter Birkholz

How to identify elliptical poems within a digital corpus of auditory poetry

Hussein Hussein, Burkhard Meyer-Sickendiek, Timo Baumann

Dynamic vocabulary with a Kaldi speech recognizer in a speech dialog system for automotive infotainment applications

Thomas Ranzenberger, Christian Hacker, Karl Weilhammer

Automatic vocal tract segmentation based on conditional generative adversarial neural network

Mohammad Eslami, Christiane Neuschaefer-Rube, Antoine Serrurier

The myoelastic-aerodynamic theory of sound production in humans, mammals, and birds

Christian Herbst

Filled pause detection by prosodic discontinuity features

Uwe D. Reichel, Benjamin Weiss, Thilo Michael

Zur Annotation nicht-verbaler Vokalisierungen in Korpora gesprochener Sprache

Jürgen Trouvain, Malte Belz

Towards ordinal classification of voice quality features with acoustic parameters

Felix Schaeffler, Matthias Eichner, Janet Beck

Analysis of coarticulation using EMA data with a statistical shape space model of the tongue

Alexander Hewer, Ingmar Steiner, Korin Richmond

Modelling vowel acquisition using the Birkholz synthesizer

Ian S. Howard, Peter Birkholz

Influence of the vocal tract morphology on the F1-F2 acoustic plane

Antoine Serrurier, Pierre Badin, Christiane Neuschaefer-Rube

Numerische Studie zum Einfluss laryngealer Areale auf individuelle und allgemeine akustische Eigenschaften des menschlichen Vokaltrakts bei gehaltenen Vokalen

Mario Fleischer, Alexander Mainka, Dirk Mürbe

2020

Sprachtechnologien für digitale Assistenten

Reinhold Häb-Umbach

Keyword Detection for the Activation of Speech Dialogue Systems

Hans-Günter Hirsch, Alexander Micheel, Michael Gref

Increasing Industrial Productivity by Employing a Smart Speech-Based Question Answering Assistant

Bojan Kovachki, Aleksandar Gjoreski, Robert Herms, Matthias Pohl, Martin Wenzel, Frank Seifert, Diane Hirschfeld

User Acceptance of Proactive Voice Assistant Behavior

Maria Schmidt, Wolfgang Minker, Steffen Werner

Überlegungen zu wahrnehmbaren Lächeln in synthetischen Stimmen

Jürgen Trouvain, Benjamin Weiss

Tongue Mouse - Comparison of Physical Measurement Principles

Kathleen Große, Peter Birkholz

Speech Fundamental Period Estimation using a Neural Network

Ian S. Howard

Articulatory Copy Synthesis using Long-Short Term Memory Networks

Yingming Gao, Peter Steiner, Peter Birkholz

Human-Computer Interaction closer to the Body

Michael Beigl

Contactless Measurement of Heart Sounds and Heart Rate with Laser Doppler Vibrometry

Kristian Kroschel, Armin Luik, Jürgen Metzler

A Hearing Aid to Visualize the Direction of Sound

Udo Gebelein, Stefan Rapp

Comparing KEC Recordings with Resynthesized EMA Data

Konstantin Sering, Fabian Tomaschek

Hesitation processing analysis using mouse-tracking and gamification

Simon Betz, Éva Székely, Sina Zarrieß, Marin Schröer, Leonie Schade, Petra Wagner

Simulating Turn-Taking in Conversations with Varying Interactivity

Thilo Michael, Sebastian Möller

Ein sprachübergreifender Vergleich des Pausenverhaltens natürlicher Sprecher in verschiedenen Sprechtempi mit TTS-Systemen

Raphael Werner, Jürgen Trouvain, Bernd Möbius

Low-Complexity Postfilter using MDCT-Domain for Speech and Audio Coding

Sneha Das, Tom Bäckström

Towards a Robust Analysis and Classification of Dog Barking

Maja Schneider, Oliver Jokisch

Spoken Language Identification by Means of Acosutic Mid-level Descriptors

Uwe D. Reichel, Andreas Triantafyllopoulos, Christopher Oates, Stephan Huber, Björn Schuller

The Nature of the Articulatory Code

Harald Höge

Comparison of the French and German articulatory spaces

Antoine Serrurier, Christiane Neuschaefer-Rube

Reduction of Aircraft Noise in UAV-Based Speech Signal Recordings by Quantile Based Noise Estimation

Enrico Lösch, Oliver Jokisch, Alexander Leipnitz, Ingo Siegert

Note Onset Detection using Echo State Networks

Peter Steiner, Simon Stone, Peter Birkholz

How to Identify Speech when Translating Unpunctuated Poetry

Timo Baumann, Burkhard Meyer-Sickendiek, Hussein Hussein

Die Welt ist nicht genug! Man muss auch über sie sprechen können

Ronald Römer, Peter beim Graben, Markus Huber, Peter Klimczak, Günther Wirsching, Matthias Wolff

Rule-Based Dialog Management for Voice Assistents in Automotive Environments

Soyuj Kumar Sahoo, Timo Sowa, Christian Hacker, Thomas Ranzenberger

Speaker Gender Classification based on an Improved Deep Learning Approach

Mohamed Anouar Ben messaoud, Aicha Bouzid

Machine Learning-Assisted Affect Labelling of Speech Data

Alicia F. Requardt, Olga Egorow, Andreas Wendemuth

Emergency Service – Sprachbasierte Klassifikation eingehender Anrufe in Ausnahmesituationen

Marcus Petersen, Karl-Heinz Niedrist, Matthias Busch, Florian Marquardt, Ingo Siegert

Uneindeutigkeiten in minimalistischen Grammatiken für Zahlworte – Probleme und Lösungsansätze

Mira Schielke, Henriette Heinrich

Filtering-Based Analysis of Spectral and Temporal Effects of Room Modes on Low-Level Descriptors of Emotionally Coloured Speech

Martin Gottschalk, Juliane Höbel-Müller, Ingo Siegert, Jesko L. Verhey, Andreas Wendemuth

Sprachtechnologien für Digitale Assistenten

Reinhold Häb-Umbach

Listening through a Cochlear Implant

Jesko L. Verhey

Zur Automatischen Schätzung von Kostenfunktionen aus Dialogen

Benjamin Weiss, Stefan Hillmann, Thilo Michael, Tilo Himmelsbach

Does Users’ System Evaluation Influence Speech Behavior in HCI? – First Insights from the Engineering and Psychological Perspective

Ingo Siegert, Matthias Busch, Julia Krüger

Vergleichende Untersuchung von Reinforcement Learning Verfahren beim Training eines Dialog Managers

Stefan Hillmann, Tilo Himmelsbach, Benjamin Weiss

Einflussfaktoren auf die Wahrnehmung von Prominenz im natürlichen Dialog

David Meier, Bistra Andreeva

Space fighters on stage - How the F1 and F2 vowel-space dimensions contribute to perceived speaker charisma

Oliver Niebuhr

Relationship Between Root Causes of Impairments and Perceptual Quality Dimensions of Super-wideband Transmitted Speech

Sebastian Möller, Tobias Hübschen, Gabriel Mittag, Gerhard Schmidt

2021

Speech Signal Compression Deteriorates Acoustic Cues to Perceived Speaker Charisma

Ingo Siegert, Oliver Niebuhr

`Alexa, who are you?´ – Analysing Alexa’s, Cortana’s and Siri’s Vocal Personality

Anabell Hacker

Pseudo-Labelling and Transfer Learning Based Speech Emotion Recognition

Siddarth Venkateswaran, Ronald Böck, Thomas Keßler, Ossmane Krini

Emotion Bias in Automatic Speech Recognition

Lara-Sophie Christmann

Age Classification: Comparison of Human vs Machine in Prompted and Spontaneous Speech

Felix Burkhardt, Markus Brückl, Björn W. Schuller

Cross-Lingual Acoustic Modeling in Upper Sorbian – Preliminary Study

Ivan Kraljevski, Marek Rjelka, Frank Duckhorn, Constanze Tschöpe, Matthias Wolff

Real-Time Implementation, Comparison, and Combination of Pitch Tracking Algorithms

Janina Reuter, Merikan Koyun, Christoph Daniel Schulze, Reinhard Von Hanxleden

Human pause detection in spontaneous speech in an online experiment

Jürgen Trouvain, Raphael Werner

Formalisierung und Implementierung einer adaptiven kognitiven Architektur unter Verwendung von Strukturdiagrammen

Werner Meyer, Borislav Borislavov, Friedrich Eckert, Christian Richter, Ronald Römer, Peter beim Graben, Markus Huber, Matthias Wolff

Audio and Video Processing of UAV-Based Signals in the Harmonic Project

Oliver Jokisch, Tilo Strutz, Alexander Leipnitz, Ingo Siegert,, Andrey Ronzhin

Automatic-Subtitling: Comparison on the Performance of Forced Alignment and Automatic Speech Recognition

Mino Lee Sasse, Stefan Schaffer, Aaron Ruß

Artificial Bandwidth Extension using a Glottal Excitation Model

Sebastian Barth, Simon Stone, Peter Birkholz

Towards reliability-guided information integration in audio-visual speech recognition

Wentao Yu, Steffen Zeiler, Dorothea Kolossa

On the Optimal Set of Features and the Robustness of Classifiers in Radar-based Silent Phoneme Recognition

Pouriya Amini Digehsara, Christoph Wagner, Petr Schaffer, Michael Bärhold, Simon Stone, Dirk Plettemeier, Peter Birkholz

Investigating the scarce data and resources problem for speech recognition using transfer learning and data augmentation

Fahrettin Gökgöz, Mahmoud Hashem

Open source automatic lecture subtitling

Benjamin Milde, Robert Geislinger, Irina Lindt, Timo Baumann

Towards Socially Interactive Agents with Explanatory Skill

Elisabeth André

Cortical Segmentation of Syllables

Harald Höge

TargetOptimizer 2.0: Enhanced Estimation of Articulatory Targets

Paul Konstantin Krug, Simon Stone, Alexander Wilbrandt, Peter Birkholz

Phonetic convergence evaluation based on fundamental frequency variability

Bistra Andreeva, Grazyna Demenko, Jolanta Bachan, Iona Gessinger, Karolina Jankowska, Bernd Möbius

Glottal Closure Instant Detection using Echo State Networks

Peter Steiner, Ian S. Howard, Peter Birkholz

Machine Learning analysis of speech and EGG for the diagnosis of voice pathology

Ian S. Howard, Julian Mcglashan, Adrian J. Fourcin

Predictive articulatory speech synthesis with semantic discrimination

Paul Schmidt-Barbo, Elnaz Shafaei-Bajestan, Konstantin Sering

The effect of Lombard speech modifications in different information density contexts

Omnia Ibrahim, Ivan Yuen, Marjolein Van Os, Bistra Andreeva, Bernd Möbius

Intents in Sprachdialogen: Eine Praxisperspektive

Benjamin Weiss, Stefan Hillmann, Sebastian Möller

VADiMoS: A Web Tool for Designing Voice Assistant Independent and Ontology Based Dialogs

Thomas Ranzenberger, Christian Hacker

Anticipatory coarticulation in predictive articulatory speech modeling

Konstantin Sering, Fabian Tomaschek, Motoki Saito

Developing the German Pronunciation Database (DAD) - an online dictionary for spoken German

Alexandra Ebel, Johannes Förster, Mathias Walther

Untersuchung von Qualitätsunterschieden zwischen gesprochener und geschriebener Sprache bei Interaktion mit einem Chatbot

Marco Braune

Der Faktor Mensch in der Mensch-Maschine-Interaktion

Daniel Duran, Sarah Warchhold

Comparison of Training Behaviour and Performance of Reinforcement Learning based Policies for Dialogue Management

Stefan Hillmann, Tilo Himmelsbach, Benjamin Weiss

Comparing BERT with an intent based question answering setup for open-ended questions in the museum domain

Md. Mahmud-Uz-Zaman, Stefan Schaffer, Tatjana Scheffler

Eine Maschinensemiotische Pertinetz-Architektur für ein menschenzentriertes User-Interface

Peter Klimczak, Markus Huber, Peter beim Graben, Günther Wirsching

Normalisierungsmethoden für Intent Erkennung Modularer Dialogsysteme

Jan Nehring, Akhyar Ahmed

All Interaction is Situated, All Language is Grounded: Implications for the Design of Spoken Dialogue Systems

David Schlangen

Natural and synthetic speech comprehension in simulated tonal and pulsatile tinnitus: A pilot study

Jacek Kudera, Marjolein Van Os, Bernd Möbius

Knock-Knock! Who’s There? The Laughter-Enhanced Virtual Real-Estate Agent

Bogdan Ludusan, Petra Wagner

Evaluating the effect of pauses on number recollection in synthesized speech

Mikey Elmers, Raphael Werner, Beeke Muhlack, Bernd Möbius, Jürgen Trouvain

Prediction of Background Noise Degradations in Fullband Speech Communication Scenarios

Sebastian Möller, Andreas Bütow

Studie zur Lösbarkeit des Problems starker Pegelschwankungen im Home-Entertainment

Georg Schmidt, Ingo Siegert

Intelligibility in Telephone Conversations with Packet Loss

Thilo Michael

2022

Producing syllables: motor planning, motor programming and execution

Bernd J. Kröger, Trevor Bekolay

Improved features driving an T-oscillator for cortical segmentation of speech into syllables

Harald Höge

Speech intelligibility prediction with hybrid auditory model- and ML-based methods: The best of two worlds?

Birger Kollmeier, David Hülsmeier, Anna Warzybok

Towards a soft fluidic elastomer tongue for a mechanical vocal tract

Peter Birkholz, Christian Kosmas Mayer, Patrick Häsner

Using semantic embeddings for initiating and planning articulatory speech synthesis

Paul Schmidt-Barbo, Sebastian Otte, Martin V. Butz, R. Harald Baayen, Konstantin Sering

Articubench - An articulatory speech synthesis benchmark

Konstantin Sering, Paul Schmidt-Barbo

Efficient exploration of articulatory dimensions

Paul Konstantin Krug, Peter Birkholz, Branislav Gerazov, Daniel Rudolph Van Niekerk, Anqi Xu, Yi Xu

Is there a hesitation bias for ambiguous color terms?

Simon Betz, Ricardo Davids, Caroline Müller, Éva Székely, Petra Wagner, Maischa Amelie Weber, Cassandra Youssef-Baronfeind, Sina Zarrieß

Analysis of phonetic/prosodic features in interaction stages

Daniel Duran, Ronald Böck

Lexical frequency and listener's response to packet loss in telephone conversations

Thilo Michael, Omnia Ibrahim

The power of conversation flow in video conference tools: evaluation of speaker change cues

Mincheng Chang, Thilo Michael, Sebastian Möller, David Schlangen

Times and turns in stimulating meetings

Ronald Böck

Upcoming new ITU-T recommendation on the evaluation of text-based chatbots

Sebastian Möller, Stefan Hillmann, Thilo Michael, Jan Nehring, Tim Polzehl

Kommunikative Komponenten sozialer Intelligenz von künstlichen kooperativen Spielenden

Casey C. Bennett, Benjamin Weiss, Jaeyoung Suh, Eunseo Yoon, Jihong Jeong, Sungmin Yang, Yejin Chae

The voice of creativity: Effects of pitch range in the voice of a robot facilitator

Kerstin Fischer, Oliver Niebuhr, Ali Asadi

Erroneous reactions of voice assistants

Lea Kisser, Ingo Siegert

Perceptual cues for smiled voice - An articulatory synthesis study

Simon Stone, Pia Abdul-Hak, Peter Birkholz

Perceptual categorization of breath noises in speech pauses

Raphael Werner, Jürgen Trouvain, Beeke Muhlack, Bernd Möbius

Einfluss von Entrauschungsverfahren auf die automatische Segmentierung mit WebMAUS

Lorenz Gutscher, Nicola Klingler, Michael Pucher

Vergleichende Evaluation von zwei Ansätzen für ein Question-Answering System

Katja Schreiber, Stefan Hillman

The Charles - A new sensor device for measuring body language and stress in speech communication

Vidar Freyr Gudmundsson, ïo Valls-Ratés, Oliver Niebuhr

F1 and F2 formant variations and inter-speaker articulatory variability: A preliminary analysis

Antoine Serrurier, Christiane Neuschaefer-Rube

The effects of the online visualization of acoustic-prosodic features of speech on speakers' productions

Kerstin Fischer, Oliver Niebuhr

Detection of salient events in an acoustical scene

Kristian Kroschel

A Window-based method for target estimation

Paul Konstantin Krug

Comparing detection methods for pause-internal particles

Mikey Elmers

Comprehension of closely related languages: A visual world eye tracking study

Jacek Kudera, Philip Georgis, Hasan Md Tusfiqur Alam, Bernd Möbius, Tania Avgustinova, Dietrich Klakow

Prosodic characteristics of Bulgarian-Accented German

Bistra Andreeva, Snezhina Dimitrova

Improving the quality of synthesized speech of a Viennese dialect speaker through speaker adaptation

Lorenz Gutscher, Michael Pucher

Emotion preservation for one-shot speaker anonymization using McAdams

Yamini Sinha, Andreas Wendemuth, Ingo Siegert

"High on emotion?" How audio codecs interfere with the perceived charisma and emotional states of men and women

Oliver Niebuhr, Ingo Siegert

2023

Comparison of Object Tracking Algorithms for Larynx Phantom Movements in Ultrasound Videos

Christian Kleiner, Peter Birkholz

Anwendung des MFCC-Plotters zur Erfassung cepstraler Unterschiede in emotionaler Sprache

Frederick Kukla, Vanessa Reichel

Analysis of Transcriptions Using Octra – A Pilot Study

Christoph Draxler

How May I Interrupt? Linguistic Design Guidelines for Proactive In-Car Voice Assistants

Anna-Maria Meck

Automatic User Experience Evaluation of Goal-Oriented Dialogs Using Pre- Trained Language Models

Mika Rebensburg, Stefan Hillmann, Nils Feldhus

A Comparison of Module Selection Strategies for Modular Dialog Systems

Philine Görzig, Jan Nehring, Stefan Hillmann, Sebastian Möller

Automatic Generation of Website-Based Multi-Turn Question-Answering Dialog Systems

Stefan Hillmann, Philine Görzig, Sebastian Möller

Going Retro: Astonishingly Simple Yet Effective Rule-Based Prosody Modelling for Speech Synthesis Simulating Emotion Dimensions

Felix Burkhardt, Uwe Reichel, Florian Eyben, Björn Schuller

Cross-Reliability Benchmark Test for Preserving Emotional Content in Speech–Synthesis Related Datasets

Jan Hintz, Andreas Wendemuth, Ingo Siegert

Collecting and Annotating Natural Child Speech Data – Challenges and Interdisciplinary Perspectives

Hanna Ehlert, Edith Beaulac, Maren Wallbaum, Christopher Gebauer, Lars Rumberg, Jörn Ostermann, Ulrike Lüdtke

Pronunciation Modelling for Children’s Speech

Christopher Gebauer, Lars Rumberg, Jörn Ostermann

A First Report on a Perceptual Trainig Study Using Percy

Birgitte Poulsen, Ocke-Schwen Bohn, Christoph Draxler

Muster der Sprechatmung in verschiedenen Sprechstilen – Eine Pilotstudie

Jürgen Trouvain, Raphael Werner

An Automatic Method for Speech Breathing Annotation

Alexis Deighton Macintyre, Raphael Werner

Hesitation Lengthening Elicitation and Detection via Target Words in a Card Game Study

Simon Betz

Somatosensory Feedback in PAULE

Konstantin Sering, Paul Schmidt-Barbo

Concept for Semantic Error Analysis in a Mobile Application for Speech and Language Therapy Support

Eugenia Rykova, Mathias Walther

RehaLingo – Towards a Speech Training System for Aphasia

Hans-Günter Hirsch, Christian Neumann, Yannic Tiggelkamp, Riccardo Fiorista, Stefan Knecht, Alfons Schnitzler, Katja Biermann-Ruben, Dietmar Bothe, Günter Bleimann, Hendrike Frieg

Training a CNN to Estimate Voice Pathology from Connected Speech Using EGG to Automatically Label the Dataset for Voicing

Ian S. Howard, Julian Mcglashan, Adrian J. Fourcin

Implementing Easy-to-Use Recipes for the Switchboard Benchmark

Dominik Wagner, Sebastian P. Bayerl, Tobias Bocklet

Bias in Flemish Automatic Speech Recognition

Aaricia Herygers, Vass Verkhodanova, Matt Coler, Odette Scharenborg, Munir Georges

Nkululeko: A Template Based System for Fast Machine Learning Experiments on Speaker Characteristics

Felix Burkhardt

The Hochschul-Assistenz-System HanS: an ML-Based Learning Experience Platform

Thomas Ranzenberger, Tobias Bocklet, Steffen Freisinger, Lia Frischholz, Munir Georges, Kevin Glocker, Aaricia Herygers, René Peinl, Korbinian Riedhammer, Fabian Schneider, Christopher Simic, Khabbab Zakaria

Transcription Portal – A Zero-configuration Workbench for Transcribing Spoken Language Recordings

Christoph Draxler, Julian Pömp

Articulatory Speech Synthesis in the Context of Speech Research and Speech Technology: Review and Prospect

Bernd J. Kröger

Can Deep Learning Help to Understand Speech Production Mechanisms?

Antoine Serrurier

Synchrony of Θ - Oscillations in Speech Perception and Speech Production

Harald Höge

Persian Speaker Classification Using Rhythmic Features

Neda Mousavi, Sven Grawunder

Approach to Speaker-Generalized Spectral Envelope Estimation by Deep Recurrent Neural Network for Speech Reconstruction in a Speech Enhancement System

Stefan Ciba, Mohammed Krini, Amir Rajabi

iDOKS: Ein integriertes Dokumentationssystem zur Zusammenfassung von Gesprächen und Meetings

Robert Wardenga, Daniel Vogel, Felix Gräßer, Mira Schielke, Leonard Starke, Rico Petrick, Torsten Rex, Jens Lehmann

Adapters for Resource-Efficient Deployment of NLU Models

Jan Nehring, Nils Feldhus, Akhyar Ahmed

Radlogistik als Anwendungsgebiet für Digitale Sprachassistenten – Ein Diskussionsbeitrag

Matthias Busch, Malte Kania, Tom Assmann, Ingo Siegert

2024

More Than Words: Advancements and Challenges in Speech Recognition for Singing

Anna Kruspe

Linguistic Politeness in Artificial Conversational Agents

Hendrik Buschmeier

Chatbot in the Museum - A Field Study of User Experience and Modality Usage

Stefan Schaffer, Eva Schwaetzer, Aaron Ruß, Oliver Gustke

Usability and User Experience of a Chatbot for Student Support

Stefan Hillmann, Philine Kowol, Adnan Ahmad, Ruochen Tang, Sebastian Möller

Interaktionsverhalten eines Avatars im digitalen sprachtherapeutischen Setting

Mathias Walther, Elisabeth Zeuner, Eugenia Rykova

Review of Usage and Potentials of Conversational Interfaces at Universities and in Students Daily Lifes

Lea Kisser, Matthias Busch, Ingo Siegert

Perception of Formant Distortion in German Words and Non-words

Uliana Eliseeva, Ivan Yuen, Bernd Möbius

Synchrony of Glottal Area Waveform Parameters During the Production of Obstruents in Vowel Context

Joao Vitor Possamai De Menezes, Christian Kleiner, Marie-Anne Kainz, Matthias Echternach, Peter Birkholz

Computergestützte Bestimmung des Sprechflusses bei Vorschulkindern

Valentin Kany, Jürgen Trouvain

The Use of Temporal Features in Cortical Segmentation of Syllables

Harald Höge

Epsilon-Verarbeitung bei Minimalistischen Grammatiken für Zahlen .

Johannes Kuhn, Matthias Wolff, Borislav Borislavov

NoiSLU: A Noisy Speech Corpus for Spoken Language Understanding in the Public Transport Domain

Mariano Frohnmaier, Steffen Freisinger, Madeline Faye Holt, Munir Georges

Ein quantenlogisch motivierter Ansatz zur Verarbeitung von Äußerungs- Bedeutungspaaren

Markus Huber-Liebl, Günther Wirsching

Octra Backend - Eine skalierbare Infrastruktur für Transkriptionsprojekte

Christoph Draxler, Julian Pömp

An Investigation of Acoustic Features of the Lower Vocal Tract for Speaker Recognition .

Peter Birkholz, Xinyu Zhang

Towards Speech Privacy Assessment for Voice Assistants: Exploring Subjective and Objective Measures for Babble Noise

Anjana Rajasekhar, Anna Leschanowsky, Nils Peters

Konzept und Evaluation eines Softwaresystems zur Unterstützung der CRM-basierten Sprechwirkungsuntersuchung

Thorben Frank Jahnke, Corinna Sonnen, Mathias Walther

In Tune With In-Poco? A New Device for Analyzing and Training the Interplay of Body Posture and Charismatic Speech Prosody

Tobias Blaabjerg Karlsen, Karl Jhon Decuzar De Castro, Emils Pipars, Iyad Ahed Abdelrahman Abdel Qader, Jose Dumitru Ilinca Sainz, Simas Srugys, Oliver Niebuhr

Can Language Models Behave Like Wine Sommeliers? Using Multiple Agents To Evaluate The Quality of Wine Descriptors Generated By Llama 2

Siddarth Venkateswaran, Ronald Böck

Supervised vs. Zero-Shot Learning Automatic Classification of Comments on Educational Videos Using Pre-Trained Language Models

Benedict Kettler, Stefan Hillmann

Is there Text in Wine? - S+U Learning-Based Named Entity Recognition and Triplet Extraction from Wine Aroma Descriptors

Siddarth Venkateswaran, Abdullah Al Foysal, Nazeer Basha Shaik, Ronald Böck

Can We See Your Response Before You Speak? Exploring Linguistic Information Found in Inter-Turn Pauses

Christian Schuler, Shravan Nayak, Debjoy Saha, Timo Baumann

Speech/Non-Speech Classification Slightly Improves Synthesis Quality in PAULE

Konstantin Sering

Evaluation of Audio Deepfakes - Systematic Review

Yamini Sinha, Jan Hintz, Ingo Siegert

Evaluating the Impact of Prosody Feature Normalization on the Controllability of Pitch in Speech Synthesis

Judith Bauer, Frank Zalkow, Meinard Müller, Christian Dittmar

Listener-Oriented Consequences of Predictability-Based Acoustic Adjustment

Omnia Ibrahim, Ivan Yuen, Wei Xue, Bistra Andreeva, Bernd Möbius

Speech Recognition Errors in ASR Engines and Their Impact on Linguistic Analysis in Psychotherapies

Martha Schubert, Yamini Sinha, Julia Krüger, Ingo Siegert

Empirical Evaluation of ASR and NLU in a Multimodal Dialogue System for Survey Answering

Philipp L. Harnisch, Stefan Hillmann

Extending HAnS: Large Language Models for Question Answering, Summarization, and Topic Segmentation in an ML-based Learning Experience Platform

Thomas Ranzenberger, Tobias Bocklet, Steffen Freisinger, Munir Georges, Kevin Glocker, Aaricia Herygers, Korbinian Riedhammer, Fabian Schneider, Christopher Simic, Khabbab Zakaria

The Influence of Signal Segmentation Methods on Rhythm-Based Speaker Recognition

Neda Mousavi, Sven Grawunder

Unsupervised Emotional Pattern Recognition Using Rhythmic and Vocal Features

Neda Mousavi, Seyyed Saeed Sarfjoo, Sven Grawunder

2025

Smiling PAULE

Konstantin Sering

Auf die inneren Werte kommt es an? – Relevanz von Stimme und Gesicht bei der Beurteilung von Attraktivität, Sympathie Und Persönlichkeit

Anabell Hacker

Recognition of audio-visual attitudes

Phrashant Khatri, Hansjörg Mixdorff, Preeti Rao, Albert Rilliard

Wortgenerator für minimalistische Grammatiken

Johannes Kuhn, Matthias Wolff, Isidor Konrad Maier

Structured review on rag- and multi-agent frameworks: literature overview

Md Monsur Ali, Abdullah Al Foysal, Siddarth Venkateswaran, Ronald Böck

Structured review on rag- and multi-agent frameworks: application-based assessment

Md Monsur Ali, Abdullah Al Foysal, Siddarth Venkateswaran, Ronald Böck

Frequency-magnitude relation of numeral words based on search-engine results

Isidor Konrad Maier, Tillmann Rosenow, Okko Tuuri, Matthias Wolff

Evaluating the user interface of the Rehalingo speech training system with aphasic patients

Hans-Günter Hirsch, Yannic Tiggelkamp, Christian Neumann, Hendrike Frieg, Stefan Knecht

Evaluating optopalatography sensor positions for command word recognition

Arne-Lukas Fietkau, João Menezes, Peter Birkholz

Cross lingual transfer learning does not improve aphasic speech recognition

Sara Mühlhausen, Sarah Gomez, Norina Lauer, Timo Baumann

Testing the strategic elicitation of creative pronunciations in monologues and dialogues

Daniel Duran, Leonie Schade, Joana Cholin, Petra Wagner

Significance scoring for summarizing lecture recordings: a multi-modal perspective

Raviteja Boddu, Anderson De Lima Luiz, Munir Georges

Evaluation of recognition errors of hybrid and transformer-based ASR systems in German video lectures

Thomas Ranzenberger, Ilja Baumann, Sebastian P. Bayerl, Dominik Wagner, Tobias Bocklet, Korbinian Riedhammer

Speech-to-text in upper Sorbian: current state

Ivan Kraljevski, Frank Duckhorn, Daniel Sobe, Constanze Tschöpe, Matthias Wolff

Rule-based grammatical error detection on spontaneous children’s speech

Christopher Gebauer, Lars Rumberg, Fabian Witt, Edith Beaulac, Hanna Ehlert, Jörn Ostermann

A multilingual corpus of German, French and Italian political discourse: goals and methodological challenges

Silvia Modena, Marcella Palladino, Vincenzo Gannuscio

Eine Datenbank für Markensprechweise (BrandDB)

Markus Brückl, Anabell Hacker, Nancy Wünderlich, Katrin Talke, Dalida Valeeva

Teilautomatisierter Workflow zur Aufbereitung grosser Audiodatenmengen für Signalbasierte Analysen

Christoph Draxler, Felicitas Kleber, Sven Grawunder, Jurgen Trouvain

Real-time audio transcriber for language barrier-free classrooms

Huiyu Liu, Gokul Srinivasagan, Munir Georges

Effects of loudness on timbre features: comparison of different languages and scenarios

Oliver Niebuhr, Rongjie Shi, Wentao Gu

The effects of lexical frequency on anticipatory voice assimilation in Bulgarian obstruents

Mitko Sabev, Bistra Andreeva, Bernd Möbius, Ivan Yuen, Omnia Ibrahim

It all starts with a little difference tensors as data and code

Markus Huber-Liebl, Tillmann Rosenow, Ronald Römer, Günther Wirsching, Matthias Wolff

State space model of airflow in the human vocal apparatus

Ian S. Howard

Cortical segmentation of syllables based on phases of Ɵ-cycles

Harald Höge

Relationship between speaking speed and pleasantness of listening speed

Daniel Schuhmann, Philipp L. Harnisch, Stefan Hillmann

Politolinguistics and spoken language processing: comparative analysis of German and Italian political speeches. A methodological framework

Marcella Palladino

Quality of experience of German machine translation and automatic text summarization

Shushen Manakhimova, Vivien Macketanz, Sebastian Möller

Adapting a student-facing chatbot to the needs of first generation students: a user experience study

Maria K. Wolters, Tatjana Kukic, Stefan Hillmann

Modular text normalization pipeline for language model training

Lisa Winkler, Melanie Schindler, Aaricia Herygers, Christian Gaida, Felix Gräßer, Rico Petrick, Frank Eisenhaber, Matthias Henker

Gender spectrum data from podcasts – a proof of concept

Jan Marquenie, Mareile Leonhardt, Sven Grawunder, Ingo Siegert

Annotation of disfluencies in child speech

Valentin Kany, Jürgen Trouvain

Pattern-based parsing of German traffic regulations (StVO) for legal knowledge graph construction

Ibrahim Siddig, Sviatoslav Tugeev, Munir Georges

Evaluating chain-of-thought prompting for abstractive dialogue summarization with large language models for German

Neha Deshpande, Stefan Hillmann, Sebastian Möller

An unsupervised approach to exploring speaking task complexity based on fluency metrics

Neda Mousavi, Sven Grawunder

Experimente zur Transkription von Verwaltungsbesprechungen und domänenangepasste Ergebnisprotokollierung

Robin Bitterlich, Oliver Jokisch, Ullrich Prax, Rocco Zimmermann

Speech technology in psychotherapy: exploring transcription tools and their potential impact

Martha Schubert, Matthias Busch, Julia Krüger, Ingo Siegert

Scalable engine and the performance of different LLM models in a SLURM based HPC architecture

Anderson De Lima Luiz, Shubham Vijay Kurlekar, Munir Georges

Optopalatographic device “OPG2023”

Arne-Lukas Fietkau, João Menezes, Jihyeon Yun, Peter Birkholz

Avatar-gestützte digitale Aphasietherapie im Projekt APHADIGITAL – Prototyp der therapeutischen Komponenten

Judith Pietschmann, Susanne Voigt-Zimmermann, Elisabeth Zeuner, Richard Fiebelkorn, Eugenia Rykova, Mathias Walther

Voice and personality – music psychological aspects in speech perception

Dalida Valeeva

Phonetic distances in L3-speech

Konstantin Sering, Yu-Hsiang Tseng, Adriana Hanulikova

ESSV Konferenz Elektronische Sprachsignalverarbeitung