ESSV Konferenz Elektronische Sprachsignalverarbeitung

1221 Results for given search request:

"" in Authors

1990




Programm und Ergebnisse der automatischen Sprachsignalverarbeitung an der TU Dresden

W. Tscheschner




Elektronische Sprachverarbeitung - Stand der Technik, Probleme, Zukunftsperspektiven

K. Fellbaum




Zur Qualifizierung des technischen Hintergrundes der automatischen Sprachsignalverarbeitung

Rüdiger Hoffmann




Ein Experimentiersystem zur Sprachsignalanalyse und -erkennung

Steffen Kürbis, V. Paul




Verfahren der elektronischen Sprachsignalverarbeitung für die Experimentalphonetik

Manfred Krause




Die Beurteilung der Leistungsfähigkeit von Spracherkennungssystemen

Helmut Mangold




Zu Ergebnissen der Intonationsforschung an der Humboldt-Universität zu Berlin

Dieter Mehnert




Der Nutzwert prosodischer Merkmale für die automatische Spracherkennung

E. Paulus, H. -D. Gerken, J. Reinecke, J. Veidt




Die Schnittstelle zwischen Sprachsignalverarbeitung und symbolischer Sprachverarbeitung

Gudrun Flach




Arbeiten zur Sprachsynthese an der TU Dresden

Ulrich Kordon, Heiko Petzold, Antje Wirth




Automatische Erkennung kontinuierlicher Sprache im Rahmen des Forschungsprojektes SPICOS

Hermann Ney




Arraytechniken zur Geräuschreduktion bei Sprachübertragung

Kristian Kroschel




Einzelworterkennung in störgeräuscherfüllter Umgebung

Dieter Becker




Simulation Neuronaler Netze zur Spracherkennung auf einer Multi-Transputer-Hardware

Dietmar Neumerkel




Sprachcodierung im digitalen Mobilfunk

H. -J. Braun




Die Erkennung von Hüllkurvenveränderungen als Systemkomponente zur Datenreduktion von Audiosignalen

Friedrich E. Blutner




Sprachsignalauswertung mit dem Expertsystem EXA 1630

Detlev Langmann




Perzeptive Untersuchungen zur Zeitstruktur von /g/-Lauten

Jörg Helbig




Sprachsynthese-Anwendungen

Ulrich Kordon




Das natürlichsprachliche Interface NLI-AIDOS

H. Helbig, F. Zänker




Text-Phonem Transformation für die deutsche Sprache mittels Neuronaler Netze

I. Santibánez-Koref, H. M. Voigt, T. Förster, C. Wolke, R. Gehne, A. Schütte, M. Fabiunke




Zur Prägnanz initialer Mikrointonation in Aussagesequenzen deutscher Sprecher

Christian Gutowski




Sprachdialogterminal als Prozeß-Schnittstelle in komplexen Steuerungssystemen

Torsten Rudolph




Anwendungsaspekte für die Integration der Spracheingabe in ein technologisches Expertensystem

Rudolf Meyer, Sylvia Mieth




Fallbeispiele der Spracheingabe

H. Mutschler




Mensch-Maschine Dialoge in natürlicher Sprache

L. Hitzenberger, H. Kritzenberger




Anwendung der rechnergestützten Sprachanalyse in der Lautanalyse bei Nutztieren

Ralf-Bernd Laube, Gunther Marx, Volker Paul




Phonetische Arbeitsstationen: Hardware und Software zur experimentellen Sprachsignalverarbeitung

Michel T. M. Scheffers, Werner Thon




Experimente zur Vektorquantisierung auf Fuzzy-Basis

Lutz Friedemann




FD-Spectrums and Their Simulation by Neural Networks

M. Reuter, R. H. Kluwe




"Rapid Prototyping" von Sprachsystemen

Joachim Zinke




Einsatz eines "Backpropagation"-Netzwerks für die sprecherunabhängige Spracherkennung von Einzelwörtern

M. Zhu, Klaus Fellbaum




Ein sprecheradaptiver Hidden-Markov-Erkenner für große Wortschätze

Karl Trottler, Fritz Class, Peter Regel




Elektronische Kommunikationshilfen mit Sprachein- und Sprachausgabe für motorisch behinderte Benutzer

Harald Klaus, Klaus Fellbaum




Das System zur elektrischen Hautreizung SEHR-3

Hans Georg Piroth, Hans G. Tillmann




Eine Computer-Lernhilfe für das Lippenlesen

Hans -H. Bothe, Dietrich Naunin




Echtzeitimplementierung eines CELP-Codecs mit ungleichgewichtigem Fehlerschutz

Kai Clüver, Thomas Gries, Hui Li

1991




Arbeiten zur Sprachcodierung und Sprachverarbeitunagm Berliner Institut für Fernmeldetechnik

Klaus Fellbaum, Peter Noll




Zu Forschungsansätzen auf dem Gebiet der technischen Sprachkommunikation

Walter Tscheschner, Rüdiger Hoffmann




Zur Veränderung akustischer Merkmale bei Akzentverlust

Dieter Mehnert




Die slowakische Sprache als Objekt der automatischen Analyse und Synthese

Á. Král, Sachia Darzagin




Verfahren zur Sprachqualitätsbeurteilung bei der elektronischen Sprachsignalverarbeitung

J. Sotscheck




Verständlichkeit der künstlichen Sprache bei Schwerhörigen

A. Fuhr-Horst, P. Plath




Klassifikation von Explosivlauten mit konsonantischem Kontext

J. Helbig




Irregularitäten im Sprachsignal - störend oder informativ?

A. Kießrling, R. Kompe, E. Nöth, A. Batliner




Über akustische Prägung beim Menschen

F. Blutner




Spracherkennung mit prädiktiven neuronalen Netzwerken

Herbert Reininger, Klaus Kasper




Kodierung linguistischen Wissens in ANNs und Kopplung an die akustische Spracherkennung

R. Deffner, H. Geiger




Psychoakustisch motivierte Vorsegmentierung fließender Sprache

D. Langmann, J. Krämer




Automatische Extraktion von Sprachmodellen für Hidden-Markov-Modelle aus einem semantischen Netzwerk

Gerhard Sagerer, Franz Kummert, G. Fink, B. Seestaedt




Automatische Erkennung fließender deutscher Sprache mit silbenorientierten Einheiten

G. Ruske, B. Plannerer




Regelbasierte Erzeugung von robusten Aussprachemodellen und deren Darstellung im Silbenraster

Florian Schiel, F. Wolfertstetter




Simulation eines Einzelworterkenners mit integrierter ein-, zwei- und vierkanaliger Störreduktion

Dieter Becker




Aspekte der textabhängigen Sprecherverifikation

L. Fliegner, Klaus Fellbaum




CELP-Verfahren mit adaptivem Anregungscodebuch

U. Kipper, Herbert Reininger, D. Wolf




Sprachverstehen im Bürobereich - Ein integriertes Konzept für den rechnergestützten Arbeitsplatz

Ruth Marzi




Einbindung von Spracherkennung in Anwendungen der Telekommunikation

J. Zinke, Stephan Euler




Sprachsynthese im Zeitbereich

Ulrich Kordon, Heiko Petzold




Blindenarbeitsplatz mit Sprachausgabe TABION

H. Brümmer




Sprachanalyse-System für PC und Workstation

A. Kohl




Transformationscodierung von Sprachsignalen bei geringen Übertragungsraten

M. Arndt




Die Nutzung des Signalprozessors TMS320C25 für die Echtzeitrealisierung von Transformationscodern

M. Arndt




Untersuchungen zum merkmalsbasierten Wörterbuchzugriff

Gudrun Flach , P. Zillmer




Unscharfe lokale Bewertungsalgorithmen für DTW-Erkenner

L. Friedemann, T. Rudolph




Phonetische Detailliertheit und Sprechermerkmale

Reinhold Greisbach, O. Esser, C. Weinstock




Prosodische Merkmale gesprochener Sprache: Generierung und Synthese

Carsten Günther




Anwendungen der Spracherkennung für motorisch behinderte Benutzer

Harald Klaus, Klaus Fellbaum




Optimierung der Sprachübertragungsqualität durch den Fernsprechteilnehmer

W. Krebber




Rechnergestützte Analyse zur Lautontogenese beim Schwein - einige biologische Determinanten, Umwelteinflüsse

R. -B. Laube, C. Igney, J. Helbig, G. Marx

1992




Professor Walter Tscheschner - Promotor der Sprachsignalverarbeitung (laudatio)

Susanne Fuchs




Sprachsynthese - ein gelöstes Problem?

Wolfgang Hess




Verfahren der Sprachübertragung und Sprachverarbeitung für gegenwärtige und zukünftige Telekommunikationsdienste

Klaus Fellbaum




Visualisierung von Sprachsignalparametern - Ergebnisse der phonetischen und sprachakustischen Forschung für die Rehabilitation Hör- und Sprachbehinderter

Dieter Mehnert




Phonembasierte Spracherkennung mit topologischen Merkmalskarten

Herbert Reininger, A. Leue




The enhancement of noisy speech for transmission and recognition

J. Uhlir, P. Sovka




Ereignisgesteuerte Spektralanalyse zur Beschreibung sehr kurzer Sprachsignalabschnitte

J. Helbig




Entropie-Profile und Epogramme von Sprachsignalen

C. Bandt, B. Pompe




Einfluß einer adaptiven Nachfilterung auf die Sprachqualität eines 2,4 kb/s ACELP-Coders

U. Kipper, Herbert Reininger, D. Wolf




Sprachcodierung bei 800 bit/s unter Verwendung eines Matrixprodukt-Segmentvocoders

S. Bruhn




Zur kritischen Periode der akustischen Prägung

Friedrich E. Blutner, C. Haller, S. Haller




Untersuchungen zur Lautdiskriminierbarkeit visualisierter Sprache

K. Hobohm, Manfred Krause




Sprachproben für Sprachqualitätsmessungen und deren phonologische Eigenschaften

J. Sotscheck




Zur Klassifikation und Beurteilung von Sprachsyntheseverfahren

C. Jürgens




Sprachsynthesemodul auf Zeitfunktionsbasis

L. Friedemann, Ulrich Kordon




Synthese der tschechischen Sprache

Robert Vích, E. Vichova, M. Ptácek




Wissensbasierte Silbenerkennung aus dem Satzverbund Ergebnisse nach einem Jahr Beteiligung am ASL-Projekt

Gudrun Flach , Rüdiger Hoffmann, J. Krämer, Steffen Kürbis, C. M. Westendorf




Das prosodische System des Deutschen aus Sicht der Sprachproduktion

Carsten Günther




Digitale Filterbank für die Sprachverarbeitung

B. Kriener, J. Reber, H. Voges




14-Bit-Sprachausgabeeinheziutm Anschluß an eine PC- Druckerschnittstelle

M. Lehning




Sprachdaten-Management mit Dnorm 3.0

T. Rudolph




Eigenschaften eines statistischen Modells auf Wortebene für die deutsche Sprache

U. Bandara, G. Möse, G. Walch

1993




European research cooperation in the speech area

J. Ekberg




Sprachsignalverarbeitung im Dienst behinderter und alter Menschen. Ein Überblick über Anwendungsmöglichkeiten

W. Zagler




Einsatz der elektronischen Sprachverarbeitung im Bereich der Medizintechnik

Helmut Mangold




Phonetische und sprachakustische Forschungen an der Humboldt-Universität zu Berlin unter Berücksichtigung der Anwendung in der Rehabilitation

Dieter Mehnert, G. Lindner




Einsatz der elektronischen Sprachverarbeitung im Behindertenbereich - Ausgewählte Beispiele

Klaus Fellbaum




Sprachtechnologie zwischen Theorie und Anwendung

Rüdiger Hoffmann




Computerunterstützte klinische und experimentelle Untersuchung zentraler Sprechstörungen

T. Ahrndt, Wolfram Ziegler, J. Teiwes




Talking Heads: Audiovisuelles Sprachlabor für den Absehunterricht mit Hörbehinderten

H. H. Bothe, D. Naunin, K. Wittien




Dreidimensionale Darstellung von Sprache und anderer akustischer Information für einen Blinden-Computer-Arbeitsplatz

K. Chrispien, Klaus Fellbaum




Phoneme-oriented approach to speech recognition in Slovak

Sachia Darzagin, Á. Král, Milan Rusko




Signalverarbeitung zur Verbesserung des Sprachverstehens mit Cochlea-Implantaten

Wolfgang H. Döring, A. Falter, H. G. Hirsch




Struktur eines Sprecherverifizierungssystems und sein möglicher Einsatz im Behindertenbereich

L. Fliegner, Klaus Fellbaum




Das TASO-Prinzip: Vollsynthetische Sprachausgabe plus Hardware hilft bei der Integration Sehgeschädigter in Beruf, Ausbildung und Freizeit

J. Frank




Sprachsynthese mit Hilfe neuronaler Netze

C. Herrmann




Linguistische Verlaufsdiagnostik bei der Anwendung elektronischer Signalverarbeitung in der Rehabilitation

W. Herrmann




Einsatz des Sprachprozessors VOICE in portablen Blindenhilfsmiteln

Diane Hirschfeld, Ulrich Kordon, W. -J. Fischer




Realzeitvisualisierung gesprochener Sprache für die Gehörlosensprechschulung mit einem Standard-PC

K. Hobohm




Zum Einsatz des HUB-Computer-Hörtrainers bei der Rehabilitation nach Eochlear-Implantation

H. Ilchmann, B. Lommatzsch, Dieter Mehnert




Sprachsynthese auf Clusterbasis nach dem PSOLA-Verfahren

C. Jürgens, Klaus Fellbaum




Prototyp eines sprachgesteuerten Notrufgerätes für motorisch Schwerbehinderte

Harald Klaus




Ein spezieller Kopfhörer mit realitätsnaher Vorneortung von Hörereignissen

F. König




Audio-taktiler Dialog über Graphiken und Diagrammen insbesondere für Blinde und Sehbehinderte

J. Lötzsch




Sprachsteuerung eines entscheidungsunterstützenden Systems

Ruth Marzi, S. Prinz




Zur elektromagnetischen Artikulographie der Konsonantenartikulation

B. Pompino-Marschal




Dialogorientierte Erfassung und Kodierung der frühen Kindersprache (DEKKS)

B. Reimann, Dieter Mehnert




Erfahrungen mit dem Einsatz von Spracherkennern mit großem Wortschatz in der Rehabilitationstechnik

P. Rohleder, M. Zhu




Robuste Worterkennung mit geringem Trainingsaufwand

T. Rudolph




Sprachdialogsysteme im ISDN

T. Schürer




Sprachausgabe in Kommunikatoren für nichtsprechende Personen

L. Seveke




Zu einigen psycholinguistischen Phänomenen bei der Editierung von Sprachsynthetisatoren

Walter Tscheschner




Sprachsynthetisator für die tschechische Sprache

Robert Vích, J. Pribil, E. Víchová




Eine auditive Oberfläche für ein behindertengerechtes Komforttelefon

Antje Wirth

1994




Sprachverarbeitung - eine Schlüsseltechnologie für die Telekommunikation

B. Lochschmidt




Applications of Automatic Speech Recognition in Dictation, Information Retrieval and Device Control

V. Steinbiß




Sprachverarbeitung für Telefonanwendungen

Harald Höge




New Audio Coding Standards

Peter Noll




Multilinguales Sprachdialogsystem für den Cityruf-Service

C. Müller




BABSY - Ein Sprachdialogsystem für Telefonanwendungen

B. Kaspar, Karlheinz Schuhmacher, Georg Fries, A. Wirth




Algorithmen zur Sprecheradaption für telefonbasierte Sprachdialogsysteme

S. Dobler




Untersuchungen zur Gestaltung eines Sprachdialogsystems im Telefonnetz

T. Schürer




Experimentelle Untersuchungen der menschlichen Einflußfaktoren bei automatischen Dialog-Systemen

O. Hartmann, K. Zünkler




Ein systematischer Vergleich von diskreten, kontinuierlichen und hybriden HMM-basierten Systemen zur Spracherkennung

C. Neukirchen, Gerhard Rigoll




Neuartiger hybrider SKHMM/KNN-Ansatz für die Spracherkennung

H. -P. Hutter, B. Pfister




Phonetische Grobklassifikation mit zeitverzögerten Neuronalen Netzen

W. Reichl, G. Ruske




Satzerkennung mit modifizierten Wahrscheinlichkeitsverläufen

T. Rudolph




Beschreibung von Aussprachevarianten

G. Flach




Veränderung spektraler Merkmale bei Akzentuierungswechsel

Dieter Mehnert




Zur Robustheit stochastischer und neuronaler Spracherkennungssysteme

Klaus Kasper, N. Nicol, Herbert Reininger, D. Wolf




Auswirkungen der phonetischen Zusammensetzung des Sprachmaterials auf die Erkennungsrate bei Sprecherverifizierungssystemen

L. Fliegner, B. Klusmann




Optimierung eines Spracherkenners für Telefonsprache

T. Schürer




Ausdruck von Stimme und Sprechweise nach Felix Trojan

W. A. Deutsch, Sylvia Moosmüller, R. Vollmann




Probleme der Verschriftung und Kodierung der frühen Kindersprache

B. Reimann, Dieter Mehnert




Bandbegrenzte Funktionen als Hilfsmittel zur Fehlerkorrektur von Grundfrequenzverläufen

M. Lehning




ARCOS-G, ein Experimentalsystem zur Erkennung kontinuierlicher deutscher Sprache

S. Safra, B. Pfister




Automatische Spracherkennung für einen Trainingssimulator

T. Lange, A. Paeseler, H. -H. Hamer, H. Bergmann




Die Behandlung von Wortkomposita in der maschinellen Spracherkennung

M. Spies




Zur akustischen Realisierung des Wortakzents

B. Heuft, T. Portele




Zum Einfluß der Abtastfrequenz auf die Qualität synthetischer Sprache

T. Portele




Ein System zur Modifikation prosodischer Eigenschaften fließend gesprochener Sprache

J. Reinecke




Sprachein- und -ausgabetechnik: Anwenderforderungen und technische Realisierbarkeit

Rüdiger Hoffmann, Ulrich Kordon




Eigenschaften von Spracherkennungssystemen in praktischen Anwendungen

A. Noll, H. Bergmann, H. -H. Hamer, A. Paeseler, H. Tomaschewski




Kundendialog in der Anlagenberatung mit Sprachunterstützung

Ruth Marzi, K. Richter




Building Voice-Activated Applications Under MS-Windows

M. Zhu, P. Rohleder




Überlegungen zum Einsatz der Chipkarte in der Sprachsignalverarbeitung

B. Kriener, Klaus Fellbaum, L. Fliegner, R. Marzbanvishka




Zur Beurteilung von Spracherkennungssystemen unter Wirtschaftlichkeitsbedingungen: Beschreibung einiger konkreter Anwendungsfälle

C. Prenzel




Fuzzy Head: Ein mechanisches Kopfmodell zur Nachbildung sichtbarer Sprechbewegungen

H. -H. Bothe




Zweidimensionale Phonemkarte des Deutschen auf der Basis visueller Lippenmerkmale

H. -H. Bothe, E. -A. Wieden




Prinzip und Einsatzmöglichkeiten eines Artikulographen

A. Zierdt




Einfluß typischer Raumänderungen auf das Übertragungsverhalten

J. Marx




Bedeutung der binauralen Signalverarbeitung zur Sprachverständlichkeit in störschallerfüllter Umpebung

K. Genuit




Verfahren zur räumlichen Darstellung synthetisierter Sprache

K. Crispien, Klaus Fellbaum, W. Würz




CELP mit phonetisch orientierter Anregung

U. Balss, Herbert Reininger, D. Wolf




Ein Sprachcodec für den asynchronen Transfermodus

K. Clüver, L. Schröder




Effiziente Interblock-Codierung der Kurzzeit-Spektralinformation in der sehr niederratigen Sprachübertragung

S. Bruhn




Anwendung der impliziten homomorphen Entfaltung für die LPC-Analyse

Robert Vích




Mehrkanal-Sprachpausendetektoren für Laufzeitsteuerungen

M. Drews




Methoden zur robusten Sprachdecodierung bei Mobilfunkkanälen basierend auf den statistischen Eigenschaften der Sprachparameter

Stefan Feldes




Ein flexibles Programmpaket zur Visualisierung von Sprachdaten

M. Reyelt




DANA - Ein Programmsystem zur statistischen Modellbildung über Sprachsignalbeschreibungen

C. -M. Westendorf




Conception of System for Speech Signal Analysis by Linear Prediction

Sachia Darzagin, Marian Trnka, Milan Rusko




Signal-zu-Rauschabstände beim freisprechend Telefonieren im Kraftfahrzeug

T. Haulick




Psychoakustisch motivierte Einzelmaße als Ansatz zur objektiven Qualitätsbestimmung von ausgewählten Sprachcodiersystemen

Jens Berger, A. Merkel




Abhängigkeit der zeitlichen Positionierung charakteristischer Mundbilder von übergeordneten Einflußfaktoren

F. Rieger, H. -H. Bothe, G. Lindner




Sprachverarbeitung in einem hierarchischen neuronalen Netzwerk

H. Behme, W. D. Brandt, H. W. Strube




Akustische Steuerung beliebiger graphikorientierter Anwendungen mittels Verbundworterkennung

Ruth Marzi, M. Pötter, Harald Klaus




Einsatz der automatischen, natürlichsprachigen Erkennung zur Steuerung von Leitwarten

B. Bitzer, R. Dömer




Objektorientierte Implementierung eines Spracherkennungssystems mit integrierter Suche

B. Plannerer




Vergleichende Beurteilung von verschiedenen Analyseparametern für die Einzelwort-Spracherkennung

O. Sahm, T. Schürer




TUBSY: Sprachsynthese auf Clusterbasis nach dem PSOLA-Verfahren

C. Jürgens




Vergleich von Transkriptionsansätzen für deutsche Namen

A. Mengel, K. Rosenke




Einsatz von neuronalen Netzen zur Transkription von orthographischem Text in Lauischrift

K. Rosenke




Labeled-Graph-Matching zur Einzelworterkennung

N. Kunstmann, P. Tavan

1995




Zur Reflektion phonetischer Kategorien durch One-state-Modelle

Walter Tscheschner




Korrelation von Sprachsignalen im Zeit- und Frequenzbereich

Robert Vích, Petr Horák, M. Schwarzenberg




Sprachpausendetektion zur Realisierung von Spektralsubtraktionsverfahren

V. Davidek, P. Sovka, J. Šika




Objektive Parameter zur Charakterisierung der Stimmqualität in emotional gehaltvoller Sprache

G. Klasmeyer, Walter F. Sendlmeier




Referenzsysteme für die auditive Qualitätsbeurteilung von synthetisch erzeugter Sprache

Harald Klaus




Anwendbarkeit eines psychoakustisch motivierten Sprachvorverarbeitungsmodells für die Sprachqualitätsmodellierung

M. Hansen, B. Kollmeier




Lokal rekurrente neuronale Netzwerke zur effizienten Realisierung eines Spracherkennungssystems

Klaus Kasper, Herbert Reininger, D. Wolf, H. Wüst




Zur Schlüsselworterkennung in fließender Sprache unter Verwendung neuronaler Netze

I. Suhardi, Klaus Fellbaum




Sprecherunabhängige Erkennung fließend gesprochener Sprache mit informationstheoretischen neuronalen Netzen und Hidden-Markov-Modellen

C. Neukirchen, J. Rottland, Gerhard Rigoll




Evaluierung von signalnahen Spracherkennungssystemen für deutsche Spontansprache

M. Lehning




Dekorrelation und Reduktion des Merkmalssatzes in Worterkennem

T. Rudolph




Sprecherunabhängige Erkennung verbunden gesprochener Ziffernketten unter Verwendung der Telefon-Sprachdatenbank TUBTEL

T. Schürer




Erkennung fließender Sprache auf der Basis diskreter Hypothesen - eine Alternative zu HMM?

C. -M. Westendorf




Symbolverarbeitung im Sprachsynthesesystem HADIFIX

T. Portele, J. Krämer, D. Stock




Generierung von Grundfrequenzverläufen in einem Sprachsynthesesystem mit neuronalen Netzen

Oliver Jokisch, Ulrich Kordon




Chinesische Sprachsynthese nach dem Prinzip der Verkettung von Zeitfunktionssegmenten

Hongwei Ding, J. Helbig




Untersuchungen zur Auswahl von Sprechern für die Sprachsynthese im Zeitbereich

C. Jürgens, B. Wehen, W. Johannsen




Robuste Vektorquantisierung zur Sprachcodierung bei gestörten Übertragungskanälen

U. Balss, Herbert Reininger, H. Schalk, D. Wolf




Einsatz der Sprecherverifizierung in Open- und Closed-line-Systemen

L. Fliegner, D. Hardt




An automatic information system operating on the voice dialogue base

J. Nouza




Die Eignung unterschiedlicher deutscher Transkriptionssystemarchitekturen für zukünftige Anforderungen

A. Mengel, K. Rosenke




Verschiedene neuronale Strukturen für die Transkription von deutschen Wörten

K. Rosenke




Ein System prosodischer Etiketten zur Transkription von Spontansprache

M. Reyelt




Abbildung prosodischer Etiketten auf prototypische FO-Verläufe

J. Reinecke




TUBTEL - Eine deutsche Telefon-Sprachdatenbank

T. Schürer, Klaus Fellbaum, S. Ahrling, D. Hardt, Harald Klaus, A. Mengel, O. Sahm, I. Suhardi




Optimale Verkettung von Silbenhypothesen

G. Flach, H. Altendorf




Statistisches Modell zur Worterkennung

Milan Sigmund




Integration natürlicher Mikrointonationskonturen in ein Sprachsynthesesystem auf Zeilfunktionsbasis

J. Helbig, U. Wunderlich




Anwendungsaspekte moderner Sprachcodierungsverfahren im Bereich der Flugsicherung

A. Wachtler




FAUST - Ein Automat erteilt Telefonauskünfte

A. Wirth, Georg Fries, B. Kaspar, Karlheinz Schuhmacher

1996




Die Sprechstimme und ihr biologischer Hintergrund

G. Tembrock




Historische Schallaufnahmen - Das Lautarchiv an der Humboldt-Universität zu Berlin

D. Mehnert




Gehörgerechte Signalvorverarbeitung zur robusten Spracherkennung in Störgeräuschen

J. Tchorz, T. Dau, B. Kollmeier




Akustische Sprachparameter zur Bewertung glottaler Pathologien

H. W. Strube, D. Michaelis, M. Fröhlich




Formantbestimmung zur Spracherkennung mit digitalen Resonatoren

L. Welling, H. Ney




Die perzeptive Wirkung ausgesuchter akustischer Parameter zur Charakterisierung des stimmlichen emotionalen Ausdrucks

G. Klasmeyer, T. Meier, A. Baeger, W. F. Sendlmeier




Experimentelle Sprachverarbeitung mit sigmalab

C. -M. Westendorf




Mikrosegmentsynthese - ökonomische Prinzipien bei der Konkatenation subphonemischer Spracheinheiten im Zeitbereich

R. Benzmüller, W. J. Barry




Variabilität und Stabilität segmentaler Merkmale unter dem Aspekt der konkatenativen Sprachsynthese - Vokale

D. Hirschfeld




Deutsch-Tschechische Sprachsynthese in einem Telefon-Auskunftssystem

J. Helbig, P. Horák




Zur Schlüsselworterkennung unter Verwendung prädiktiver neuronaler Modelle

I. Suhardi




Ein zweistufiges System zur automatischen Sprachen-Identifikation

J. Navrátil, W. Zühlke




Untersuchungen zum Einsatz der Störreduktion in der Sprecherverifizierung

D. Hardt




Einflüsse des Urteilsverhaltens von Versuchspersonen auf die Ergebnisse bei auditiven Sprachqualitätsmessungen

H. Klaus, W. Koch




Auditive Illusionen (MacDonald-McGurk-Effekt) zur Evaluierung einer Computer-Animation von sichtbaren Sprechbewegungen

D. Mehnert, A. Saß, H. H. Bothe




Ein audio-taktiles elektronisches Grafik- und Textbuch für Blinde

J. Lötzsch, G. Rödig




Speech Training and Motivating Tools for Hearing-Impaired People

J. Nouza, D. Hájek




Generation of Prosodic Rules for TTS by Quantitative Analysis of F0 Contours

H. Mixdorff




Evaluierung der automatischen Parametisierung von Grundfrequenzkonturen

B. Heuft, B. Streefkerk, T. Portele




Untersuchungen zur Satzakzentuierung

G. Sonntag




New Prosody Modelling System for Czech Text-to-Speech

P. Horák, J. Tučková, R. Vich




Stilisierung von Intonationsverläufen auf Wortebene

A. Mengel




Sprachstatistische Auswertungen an Prüftexten zur Sprachqualitätsbeurteilung

J. Berger




Text-und Dokumentaufbereitung für die Sprachsynthese

G. Flach




Anwendung von synthetischer Sprachausgabe zur Steigerung der Mobilität von Blinden

J. Frank, W. Frasch, L. Frost




Sprachsynthesehardware für Blindenhilfsmittel

T. Funke, U. Kordon




Visualization of Data and Procedures in Speech Processing Tasks

D. Hájek, J. Nouza




Entwicklung eines interaktiven Moduls zur Ausspracheschulung mit einem phonetischen Experimentiersystem

U. Hollmach, O. Schröder




Lautanalyse zur Bewertung der Belastungslaute von Hühnerküken - Möglichkeiten der Diagnose von Einflüssen auf ihre sozialen Beziehungen

G. Marx




The TELES-Electronic Secretary - An Innovative ISDN Application

H. Mixdorff, K. Rosenke, H. Witt




Dynamische Anpassung der Sprechgeschwindigkeit

T. Portele




Analyse der Fehler verschiedener neuronaler Netzstrukturen zur Transkription deutscher Wörter

K. Rosenke




Ein Cepstrum-Prozessor für Sgmalab

M. Wolff

1997




New Algorithms for Digital Audio

P. Noll




Robustes Sprachverstehen und robuste Dialoge - Zwei entscheidende Elemente für die praktische Anwendung der automatischen Sprachverarbeitung

H. Mangold




Applikationsspezifische Sprachmodelle - Erstellung und Anpassung

A. Paeseler, H. Bergmann, H. -H. Hamer, A. Noll, H. Tomaschewski




Trends und Highlights in der elektronischen Sprachsignalverarbeitung

K. Fellbaum




Bilinguale Sprachverarbeitung zur Dateneingabe mit SpeeData - Ansätze und erste Ergebnisse

U. Ackermann




Untersuchungen zur hybriden HMM/MLP-basierten Schlüsselworterkennung

I. Suhardi, H. -G. Kim




Untersuchungen zur textunabhängigen Sprecherverifizierung mit begrenztem Wortschatz

D. Hardt




Evolutionäre Optimierung schneller Worterkenner für Telefonsprache

T. Rudolph




Ein robustes System zum Freisprechen im Kraftfahrzeug

K. Kroschel, M. Ihle




A quasi-triphone model created by merging context-specific phone models

D. Hájek, J. Nouza




Methoden zur Bestimmung der Sprachübertragungsqualität von Freisprecheinrichtungen

H. Klaus




Sprachqualitätsuntersuchungen in europäischen Fernsprechnetzen

J. Berger, T. Scheerbarth




Modellierung von Konversationen über Freisprecheinrichtungen und die Bestimmung der Sprachqualität mit Listening Only-Tests

A. Dehnel, J. Berger, H. Klaus




Datengetriebenes Training von Aussprache-Wörterbüchern - Methoden und Experimente

C. -M. Westendorf, M. Wolff




Nutzung eines feed-forward-Netzes in der automatischen Lautsegmentierung

K. Stöber




Linguistische Konzepte und ihre Rolle in der inhaltsgesteuerten Sprachsynthese

G. P. Sonntag, T. Portele




Silben- oder Lautdauersteuerung?

H. Meyer, T. Portele




Neuronale Prosodiegenerierung in der Sprachsynthese

O. Jokisch, M. Pescheck




Konkatenative Sprachsynthese mit vollautomatisch generiertem "Triphon-Inventar"

M. Holzapfel




Kodierung von Intonationsverläufen mittels Linearer Prädiktion

J. Mersdorf, A. Rinscheid, M. Brüggen, K. U. Schmidt




Dynamische Bausteinauswahl zur Synthese fließender Sprache

D. Hirschfeld, M. Eichner




Ein offener modularer Simulator für Untersuchungen zur Sprachübertragung über ATM

I. Kliche, R. Kapust, P. Noll




Zu den Grundlagen der Sprachsignalverarbeitung

H. Boche, T. Ferchland, J. Fischer, H. Schreiber




Generierung von Bildunterschriften zur Erklärung von räumlichen Zusammenhängen

K. Hartmann, B. Preim, T. Sommerfeld, T. Strothotte




Halbautomatische Nachsynchronisation von Videofilmen - Anwendungen zur Demonstration des McGurk-MacDonald-Effekts

T. Hetmank, H. -H. Bothe




Cepstrales Sprachsynthesesystem für die tschechische Sprache

R. Vich, J. Přibil, M. Ptáček




Automatische Erzeugung von Trainingsdaten für wortorientierte Spracherkennungssysteme

M. Prätzas, H. Reininger




Einflüsse von Störungen analoger Telefonleitungen auf die Qualität von Voice-over-Data-Verbindungen

M. Grell




Einsatz von A-priori-Wissen über Codecparameter zur Detektion von Übertragungsfehlern am Beispiel des G.728 LD-CELP-Algorithmus

A. Wachtler




Ein quantitatives Konzept des artikulatorischen Aufwandes

B. J. Kröger




Segmentierungs- und Konkatenationsprobleme bei der Erstellung einer Lautelementebibliothek für ein Sprachsynthesesystem

B. Ketzmerick




Zur Integration von gesprochener Sprache, Texten, Grafiken und Videos in eine multimediale Online-Vorlesung

H. -J. Ullmann




Das akustische Korrelat des deutschen Wortakzents

A. Mengel

1999




Zehn Jahre elektronische Sprachsignalverarbeitung im Spiegel einer Konferenz

K. Fellbaum, R. Hoffmann, D. Mehnert




Multimodale Mensch-Technik-Interaktion

S. Rapp




Klangvorstellung und Klangrealisation bei Musikern

W. Auhagen




Gegenüberstellung von Analyse durch Synthese und Rückwärtsprädikation

N. Görtz




Modellierung des Nasaltrakts

F. Ranostaj, K. Schnell, A. Lacroix




Parameterbestimmung für Pol-Nullstellen-Modelle

K. Schnell, A. Lacroix




Eine modifizierte nichtlineare Zeitachsentransformation für die spektrale Transformation von Stimmen

M. Geravanchizadeh, M. Schaaf




Ein Subband-Audio-Codec mit niedriger algorithmischer Verzögerung auf der Basis des ITU-T LD-CELP-Standards G.728

M. Prangenberg, F. Kurth, K. Fischer, J. Stegmann




Voice over IP - Eine exzeptionelle Herausforderung an die Qualität einer textabhängigen Sprecherverifizierung in der Telekommunikation

D. Hardt, R. Kapust, K. -D. Michael, S. Schönfuß




Integrating Noise Suppression in LPC-based Speech Codecs

K. Kroschel, J. Barros




Zum Einsatz fraktaler Verfahren in der Sprachkompression

S. Schneider




Sprachqualität in paketorientierten Netzen aus Benutzersicht

F. Kettler, E. Diedrich




VODIS/ VODIS Il: Sprachbedienung von Fahrer-Informations-Systeme im KFZ

J. Breuninger




Zum Einsatz von animierten sprechenden Agenten in einer Web-fähigen Stadtführer-Applikation

S. Feldes, G. Fries, A. Corbet




Ein mehrsprachiges multifunktionelles Auskunftsdialogsystem

V. Matoušek, E. Nöth




Zur Problematik der Sprachein- und -ausgabe im WWW

B. Ketzmerick




Multilinguale korpusbasierte Sprachsynthese auf der Basis domänenspezifischen Ausgangsmaterials

P. Wagner, F. Haas, K. Stöber, J. Helbig




Ein Werkzeug zur automatischen Inventargenerierung: Workflow und automatische Markierung

U. Koloska, M. Wolff, T. Rudolph




Datengetriebener Aufbau eines Aussprachelexikons — Diskussion experimenteller Ergebnisse

M. Eichner, M. Wolff




Lokal rekurrente Netzwerke zur Schlüsselworterkennung

K. Kasper, H. Reininger




Erzeugung von Phonem-Hypothesengittern für das automatische Training von Aussprachewörterbüchern

T. Rudolph, U. Netz




Robuste Kommandoworterkennung - die harten Beurteilungskriterien der Nutzer

G. Uhlrich




Application of Recognition Techniques for Mandarin Syllables to German Alphabet Recognition

H. Mixdorff, Y. -F. Liao, S. -H. Chen




Schätzung von sprecherspezifischen Vokaltraktparametern

H. Freienstein, K. Müller, H. W. Strube




Datengetriebene Vorgehensweise zur Disambiguierung linguistischer Kategorien und zur Satzendemarkierung

H. -U. Hain




Zur Machbarkeit von Synthese emotionaler Sprache ohne Modellierung der Stimmqualität

M. Schroeder




Der Einsatz elektronischer Medien in der Lehre: Die Visualisierung gesprochener Sprache in der wissenschaftlichen Ausbildung zur elektronischen Sprachsignalverarbeitung

J. Ullmann




Effizientere Nutzung von Trainingsdaten für das Wörterbuchlernen durch eine verallgemeinerte hierarchische Gliederung der Wortliste

M. Wolff




Sprachgestütztes automatisches Informationssystem auf Internet-Basis

U. Schultheiß, T. Kunkel




Ermittlung des Einflusses von Burstfehlern auf die Sprachverständlichkeit

A. Wachtler, R. Irmer

2000




Elektronische Sprachsignalverarbeitung — Stand der Technik, Zukunftsperspektiven

K. Fellbaum




Sprachsynthese vom Korpus — neue Verfahren zur Qualitätsverbesserung

W. Hess




Instrumentelle Sprachqualitätsmessverfahren für moderne Telekommunikations-Technologien

H. Klaus




Störgeräuschreduktionsverfahren für den Mobilfunk

R. Martin




Spracherkennung und Sprachsynthese auf dem Weg zur richtigen Anwendung

H. Mangold




Vergleichende Übersicht von auditiven und instrumentellen Verfahren zur Sprachqualitäts-Beurteilung im Bereich der Sprachsynthese

D. Höpfner




Störgeräuschreduktion bei mobiler Kommunikation - Möglichkeiten einer Instrumenteller Qualitätsbeurteilung

F. Kettler, H. -W. Gierlich, E. Diedrich




Robust Echo Cancellation

K. Kroschel, M. Heckmann, J. Vogel




Spektrale Transformation von Stimmen

M. Geravanchizadeh




Multilinguale Etikettierung natürlicher Sprachsignale auf Basis synthetischer Referenzsignale

G. Strecha, J. Helbig




Sprecherspezifische Charakteristika im Zeit- und Frequenzbereich

B. Ketzmerick




Ein Gateway zur sprachlichen Interaktion mit Webseiten über Telefon

S. Feldes, J. Stegmann




Building Voice Enabled Internet Portals based on VoiceXML

C. Günther, M. Klehr, S. Kunzmann, T. Roß




Evaluation der Benutzbarkeit von sprachverarbeitenden Softwaresystemen

R. Marzi




Sprachbasierte Benutzungsoberfläche für Smart-Home-Anwendungen

M. Hampicke




Dekodierung emotionaler Sprechweisen durch Patienten mit Innenohrprothese

A. C. Saß, W. F. Sendlmeier




Reduktionsanalyse mit CART

S. Breuer




Ein kombiniertes Spracherkennungs-/Sprachsynthesesystem auf Phonemebene

M. Eichner, M. Wolff, R. Hoffmann




Ausgewählte Probleme beim Test robuster Kommandoworterkenner

G. Uhlrich




Ein hybrider Ansatz zur Graphem-Phonem-Konvertierung unter Verwendung eines Lexikons und eines neuronalen Netzes

H. -U. Hain




Sprecherunabhängige automatische Lautsegmentierung unter Verwendung synthetischer Sprache: Einfluss psychoakustisch motivierter Vorverarbeitung und des Skalierungsfaktors von DTW

K. Stöber




Weiterentwicklung einer Netz-Topologie zur Generierung von FO-Verläufen

C. Erdem




Eine Entwicklungsumgebung zur Erstellung internetbasierter Tutorien für die elektronische Sprachsignalverarbeitung

M. Wolff, M. Eichner, R. Hoffmann




Fraktale Sprachkompression — praktische Erfahrungen

S. Schneider




Analyse von MRT-Daten zur Entwicklung eines vokalischen Artikulationsmodells auf der Ebene der Areafunktion

B. J. Kröger




Effiziente Vokaltraktlängennormierung in der automatischen Spracherkennung

S. Molau




Untersuchungen zu visuellen Sprechhilfen für Gehörlose

M. Pritsch




Anforderungen, Probleme und Erfahrungen zur Kommunikationsunterstützung beim multimedialen Teleteaching mit dem Schwerpunkt der Sprachkommunikation

H. -J. Ullmann




Dialogsysteme in eCommerce für Behinderte

V. Matoušek




Robuste Sprachsignalerfassung im KFZ durch Ortung und Beamformung auf den Mund des Sprechers

K. Tontch




Probleme und Lösungen zur automatisierten Implementierung von Sprach-Erkennungssystemen

C. -M. Westendorf




Entwicklung und technische Realisierung eines interaktiven Sprachtrainers für Hör- und Sprechgeschädigte

W. Friedhoff, R. Ichmann, R. Ose

2001




Achtzig Jahre Phonetik an der Universität Bonn

Wolfgang Hess




Zum Design von Sprachqualitätsmessungen für Sprachsynthese-im-Gebrauch: Einige grundlegende Aspekte

Ute Jekosch




Phonetische Variation als Funktion unterschiedlicher Sprechstile

Walter F. Sendimeier




Untersuchung der Faktoren Dauer und Koartikulation bei der Modellierung von Sprechgeschwindigkeit in der Spracherkennung

Britta Wrede, Gernot A. Fink, Gerhard Sagerer




Lichtsteuerung per Sprache - eine greifbare Vision Realisierungsaspekte einer nutzerakzeptablen Sprachsteuerung für die gesamte Wohnung

Günter Uhlrich




Erweiterung der Heuristischen Evaluation für sprachgesteuerte Softwaresysteme - Ergebnisse der Evaluation

H. Klemmert, H. Brau, Ruth Marzi




Aufbau und Optimierung eines deutschsprachigen Spoken Document Retrieval Systems für Bundestagsreden

Konstantin Biatov, Martha Larson, Joachim Köhler




Weighted Fusion of Audio and Video Data for Robust Speech Recognition

Kristian Kroschel, Thorsten Wild, Martin Heckmann, Frederic Berthommier




Structure-motivated lexicon refinements for German language LVCSR

Martha Larson




Vorwärtsmarkierung für cepstrum-basierte Spracherkennungssysteme

Sascha Wendt, Gernot A. Fink, Franz Kummert




Das Projekt ALERT: Entwicklung eines deutschen Spracherkennungssytems für Radio- und Fernsehnachrichten

Steffen Werner, Andreas Kosmala, Gerhard Rigoll




BLF - Ein Labelformat für die maschinelle Sprachsynthese mit BOSS II

Stefan Breuer, Julia Abresch, Petra Wagner, Karlheinz Stöber




Eine vergleichende Untersuchung von Markup Languages für Sprachdialoganwendungen

Rachid Elyoussfi, Christoph Luber, Stefan Feldest, Ulrich Schultheiß




Evaluation der Qualität deutscher Sprachsynthesesysteme mit Hilfe auditiver Hörtest

Dirk Höpfner




Das funktionale Artikulationsmodell FART: Modellierung von zeitlicher und räumlicher Koartikulation

Bernd J. Kröger




Visuelle Sprechhilfen für Hörbehinderte

Marcus Pritsch




Synthese von Vokalen mit einem Oszillatormodell unter Berücksichtigung der Stimmlosen Anregung

Erhard Rank




Gestaltung von Testumgebungen zur Beurteilung von Sprachproben

Christian Richter




Zur Akzentuierung semantischer und pragmatischer Fokusse

Hans-Christian Schmitz, Bernhard Schröder, Petra Wagner




Entwicklung und Einsatz automatischer Sprach-Übersetzung für Telefon-Dienste

Christiane Thielemann, Stefan Feldes, Christoph Luber




Sprachverstehen und Dialogplanung in einem multimodalen Kommunikationssystem mit gemischter Dialog-Initiative und virtueller Agentin

Stefan Feldes, Georg Fries




Ein Dialogsystem für blinde und sehbehinderte Programmierer

Vaclav Matoušek, Roman Mouček, Karel Taušer




Auditive und instrumentelle Verfahren zur Sprachqualitätsmessung - eine vergleichende Übersicht

Klaus Fellbaum, Dirk Höpfner, T. Lüdtke




Assessment of Quality for Audio-Visual Signals over Internet and UMTS

Harald Klaus




Multiple Descriptions and Missing Data Estimation for Voice over Packet-Switched Networks

Rainer Martin, Frank Mertz




Test- und Optimierungsmöglichkeiten in Voice over IP-Szenarien

Frank Kettler, Hans Wilhelm Gierlich, Frank Rosenberger




Generierung von Betonungsmarkern für ein multilinguales Sprachsynthesesystem

Achim F. Müller, Rüdiger Hoffmann




Datengetriebene Optimierung von Eingangsgrößen der Prosodiegenerierung

Çağlayan Erdem, Hans Georg Zimmermann, Rüdiger Hoffmann




Relevanz der Prosodie für die Simulation von Sprechstilen in synthetischer Sprache

Hans Kruschke




Resynthese von Sprachsignalen mit Kettenfiltern durch periodensynchrone Analyse und lautunabhängige Anregung

Karl Schnell, Arild Lacroix




Der Einsatz von Text to Speech in den Informationsdiensten der DTAG

Kerstin Fettke




Sprachsynthese bei orthographischen Fehlschreibungen

Reinhold Greisbach, Frank Christian Stoffel




Speech Spectrum Smoothing by Homomorphic Processing

Robert Vich, Jir̆i Pr̆ibil




Sprachdialog für die Unterstützung bei der Fehlerdiagnose an CNC-Werkzeugmaschinen

Ruth Marzi, P. John




Optimierung der Eingabe eines neuronalen Netzes zur Bestimmung der Wortbetonung mit Hilfe von Weight Decay

Horst-Udo Hain, Hans Georg Zimmermann




Einschwingphase von Vokalen bei emotionaler Sprechweise

Astrid Paeschke, W.F. Sendlmeier




Comparing a Data-Driven and a Rule-Based Approach to Predicting Prosodic Features of German

Hansjörg Mixdorff, Oliver Jokisch




Stimmklang und Sprechtempo als charakteristische Merkmale von Stimme

Bettina Ketzmerick




Untersuchungen zum statistischen Zusammenhang zwischen orthographischer und phonetischer Repräsentation deutscher Wörter

Matthias Wolff, Matthias Eichner




Eine neue Sprachdatenbank mit der Sprache unter Stress

Milan Sigmund, Ondřej Severnak




Systematische Überprüfung deutscher Wortbetonungsregeln

Petra Wagner

2002




Prof. Dr.-Ing. habil. Walter Tscheschner — Laudatio zum 75. Geburtstag

D. Mehnert




R und kein Ende

H. Ulbrich




Japanese speech recognition

D. Langmann




Über die Evolution von Voice-Portalen

V. Naumburger




Digitale Signalverarbeitung für akustische Mensch/Maschine-Schnittstellen

W. Kellermann, W. Herbordt, Herbert Buchner




Lip parameter extraction for speechreading

Kristian Kroschel, Martin Heckmann




Anwendung einer robusten Sprachsteuerung im „Smart Home“ sowie im industriellen Umfeld

Günter Uhlrich




Ein Simulationssystem zur Untersuchung des Einflusses von Übertragungskanälen bei Smart-Home-Anwendungen

J. Krebber, Sebastian Möller, Alexander Raake, S. Rehmann, Jens Berger, W. Johannsen




EU-Förderprojekt VAMP für Applikationen der elektronischen Sprachsignalverarbeitung

G. Wolf, T. Reichert




Spracheingabe bei der technischen Inspektion von Kraftfahrzeugen

J. Helbig, B. Schindler




Regulierbare Verarbeitungsgeschwindigkeit automatischer Spracherkennungssysteme durch dynamische Suchraumeinschränkung

Sascha Wendt, Gernot A. Fink, Franz Kummert




Akustische, mobile Fernunterstützung bei der Fehlerdiagnose an CNC-Werkzeugmaschinen

Ruth Marzi, P. John




Optimierung der Erkennungsleistung von sprecherabhängigen, HMM-basierten Spracherkennem

Ronald Römer, Uwe Koloska, Diane Hirschfeld




Automatische Segmentation für ein regionales Sprachkorpus des Deutschen

F. Greisbach, Frank Christian Stoffel, M. Warnking




Mixed-unit language models for German language automatic speech recognition

Martha Larson, S. Eickeler, Konstantin Biatov, Joachim Köhler




Automatische Auswertung von Radio- und Femsehnachrichten: Fortschritte in der Spracherkennung und Themenidentifikation

U. Iurgel, Andreas Kosmala, S. Werner




microDRESS - ein TTS-System mit geringem Ressourcenbedarf

Rüdiger Hoffmann, Hans Kruschke, Guntram Strecha, M. Küstner, Markus Schnell, Oliver Jokisch, Diane Hirschfeld




Towards multimodal interfaces for embedded devices

Volker Fischer, Carsten Günther, J. Ivanecky, J. šedivy, L. Ureš




The SBF1005T IC - A versatile platform for embedded speech technology and pattern recognition solutions

T. Hase, D. Langmann




Sprachdialoge für Embedded-Anwendungen

M. Küstner




Network-based vs. distributed speech recognition in adaptive multi-rate wireless systems

Tim Fingscheidt, S. Aalburg, Sorel Stan, Christophe Beaugeant




Entwicklungsschritte eines Hardware-Kommandoworterkenners mit minimalem Footprint

Diane Hirschfeld, J. Bechstein, Uwe Koloska, T. Richter, Rico Petrick




Von der sprechenden Maschine zum kommunikativen Auto

A. Weil




Rapid Prototyping für Embedded-Sprachapplikationen

R. Coppens, R. Sambeth




Design von Benutzerschnittstellen für Sprachbediensysteme im KFZ

Bärbel Jeschke




The tight relation between acoustic echo cancellation and residual echo suppression by postfiltering

G. Enzner, Peter Vary, Rainer Martin




Confidence scoring of time difference of arrival estimation for speaker localization with microphone arrays

Dirk Bechler, Kristian Kroschel




Analyse und Erzeugung von Nasalvokalen mittels verzweigter Rohrmodelle

Karl Schnell, Arild Lacroix




Separate Messung und Analyse von Mund- und Nasensignalen bei natürlicher Sprache

M. Bettinelli, Karl Schnell, Arild Lacroix




Messung und Simulation der Akustik des Nasaltrakts

F. Ranostaj, Arild Lacroix




Experimente mit der Anwendung der Pseudokorrelation bei der Vokaltraktmodellierung

Robert Vích




Distanzcodierung für asynchrones CDMA

W. Zühlke




Die Verwendung von DTW für die instrumentelle Qualitätsbeurteilung von Sprachsynthese: Chancen und Probleme

Karlheinz Stöber




Umsetzung semantischer Konzepte in gesprochene Sprache

Markus Schnell




Syntax and prosodic phrasing in news reading

Hansjörg Mixdorff




Regelbasierte Generierung fremdsprachlich akzentgefärbter Aussprachevarianten

Stefan Schaden




Temposteuerung in der Sprachsynthese durch prosodische Phrasierung

Jürgen Trouvain




Sprachmodell-Berechnung beim Übergang auf eine neue Anwendung

J. Adelhardt, E. Nöth, G. Stemmer, H. Niemann




Generierung sprechstilspezifischer Prosodie mit einem datenbasierten Lermverfahren

Hans Kruschke, Oliver Jokisch




Quantitative Untersuchung zur Prosodie des Neuhebräischen

M. Görsch, G. Splittgerber, Hansjörg Mixdorff




Selection of non-uniform units and acoustic prosody parameters by syllable based optimality criterions

C. Erdem, F. Beck




Über die Rolle der Audio-Komponente bei der Multimedia-Kommunikation

Klaus Fellbaum, Bettina Ketzmerick




Untersuchungen zum Einsatz von Sprachtechnologien in der Lernumgebung eines intemetbasierten Studienganges

Matthias Eichner, Matthias Wolff




Embotionalität im multimodalen Mensch-Maschine-Dialog: Ein Integrationsansatz

A. Wirth, Stefan Feldes, Karlheinz Schuhmacher




Dialogsystementwicklung mit einer Offenen Voice Application Platform (OVAP)

T. Winterkamp




Zum Einsatz akustischer Komponenten im E-Leaming-Modul „Elektronische Sprachsignalverarbeitung“

Bettina Ketzmerick




Entwurf eines Frameworks für audiovisuelle Sprachsynthesesysteme

Sascha Fagel, Walter F. Sendlmeier




Implementierung von Dialogmodellen in VoiceXML

Václav Matoušek, J. Schwarz




Sprachoberfläche für PDA-Applikationen

U. Schultheiss, T. Müller, V. Munde, A. Weil




Erhöht gesprochene Interaktion die Nutzungsfreundlichkeit von Software? Ergebnisse einer empirischen Studie

H. Klemmert, C. Stock, Ruth Marzi




Optimierung internetbasierter auditiver Sprachgütemessungen

Christian Richter




Das automatische Fahrplanauskunftssystem DORIS

G. Flach, U. Jung

2003




CHIL Computing to Overcome Techno Clutter

A. Waibel




Hybrid Analytic/ANN-Based Acoustic-Phonetic Decoding

K. Ekštein, V. Matoušek, R. Mouček




Mel-Freguenzanpassung der Minimum Varianz Distortionless Response Einhüllenden

M. Wölfel




Adaptive Audio-Visual Speech Recognition in the Presence of Audio and Video Distorsions

M. Heckmann, K. Kroschel, F. Berthommier, C. Savariaux




An Experimental Framework for Lipreading

I. Shdaifat, R. Grigat, D. Langmann




Robuste Phrasendetektion durch zweistufige Sprach/Pause-Detektion

T. Richter, Rico Petrick, Diane Hirschfeld




Entwicklung und Optimierung automatischer Bestimmung der Wortgrenzen

L. Dzbanek, M. Sigmund




Chorus Detection in Songs of Pop Music

V. Mildner, P. Klenner, K. D. Kammeyer




Vergleich von automatischer und manueller Segmentierung von Fernsehnachrichten und deren Einfluss auf die Sprach- und Themenerkennung

U. lurgel, S. Werner, Gerhard Rigoll




Automatic Segmentation and Labeling of Speech Signal

K. Ekštein, V. Matoušek, T. Pavelka




Robust Speech Recognition Based on Localized Spectro-Temporal Features

B. Meyer, M. Kleinschmidt




Domänenspezifische Sprachmodelle und Konfidenzmaße für die Domänendetektion und die Verringerung von Erkennungsfehlern

A. Berton, H. Hüning, H. Kretzschmar




Importance of Early and Late Reflections for Automatic Speech Recognition in Reverberant Environments

H. Gölzer, M. Kleinschmidt




Joint Source-Channel Coding for Coded Speech Transmission

N. Görtz




Emotionserkennung in einem automatischen Dialogsystem: Ist der Mensch besser als die Maschine?

V. Zeißler, J. Adelhardt, E. Nöth




Auswirkungen affektiver emotionaler Sprecherzustände auf das Schwingverhalten der Stimmlippen

R. Winkler, W. Sendlmeier




Signalverarbeitungskomponenten zur Verbesserung der Kommunikation in Fahrzeuginnenräumen

T. Haulick, G. Schmidt




Mehrkanalige Geräuschunterdrückungssysteme mit adaptiver Selbstkalibrierung

M. Buck




Untersuchungen zum Einsatz von Mikrofonarrays in Verbindung mit Spracherkennungssystemen

G. Uhlrich, D. Schuchardt, H. Baesekow




Laufzeitgesteuerte Echokompensation in IP basierenden Telefonnetzen

W. Brandstätter, Frank Kettler




Multimodale Sprecherlokalisation für Mensch-Roboter-Interaktionen in einer Multi-Personen-Umgebung

S. Hohenner, S. Lang, M. Kleinehagenbrock, G. A. Fink, F. Kummert




Evaluation of the precedence effect for speaker localization using microphone arrays

D. Bechler, L. Cridlig, K. Kroschel




Comparison of two Realisations of a Differential Microphone Array for Spectral Subtraction

M. Ihle




Modellierung der Sprachproduktion mit einem biomechanischen Zungenmodell

P. Perrier




Verwendung eines Sprachmodells zur Modellierung und Synthese von Spontansprache

S. Werner, M. Eichner, M. Wolff, R. Hoffmann




Sprachanalyse und -erzeugung mit verlustbehafteten zeitdiskreten Rohrmodellen

K. Schnell, A. Lacroix




Evaluation eines Sprachsynthesesystems nach dem Prinzip der Nonuniform Unit Selection

R. Hammerstingl, S. Breuer




Instrumentelle und auditive Qualitätsbeurteilung bei der korpusbasierten Sprachsynthese

E. Paulus, J. Steffens




Muss synthetische Sprache immer langweilig klingen?

Jürgen Trouvain




Akustisch-Phonetische Merkmale in verschiedenen Stilen gelesener Sprache

H. Kruschke




Das audiovisuelle Sprachsynthesesystem MASSY - Implementierung und Optimierung

S. Fagel, W. F. Sendlmeier




Videorealistische audiovisuelle Synthese basierend auf Unitselection

C. Weiss




PEMO_Q - Audio Quality Assessment Using a Model of Auditory Perception

R. Huber, B. Kollmeier




Construction of an individualized visual speech-synthesizer from orthogonal 2D-images

A. Niswar, K. Kroschel




Prosodiemodellierung im freien Text-to-Speech-System Epos mit neuronalen Netzen

P. Horák, D. Sobe




Preprocessing and Prosody Generation for a TTS System with a Very Small Footprint

H. -U. Hain, T. Volk, T. Fingscheidt




Ein Experimentalsystem zur Sprachakustik und Sprachproduktion

F. Ranostaj, A. Lacroix




Sprachsignalverarbeitung in der Automobilindustrie

J. Schultz, H. Wengelnik, G. Gruchalski




Sprachsignalverarbeitung für den Mobilfunk: Eine Übersicht und Trendanalyse

M. Ihle




A Text-Independent Speaker Verification Approach for Mobile Devices

P. Setiawan, S. Aalburg, T. Fingscheidt, S. Stan, G. Ruske




Skalierbare Voice-Plattform mit Unterstützung multimodaler Interaktion

G. Boi, L. Both, F. Englert, K. Kasper, L. Krejsa, H. Reininger, G. Schmidt, K. Sehnert, M. Thiel, M. Wagner




Elektronische Sprachsignalverarbeitung in der industriellen Anwendung - Ergebnisse des EU-Förderprojektes VAMP

G. Wolf, T. Reichert




Sprachsteuerungen im Praxistest - Das Apollo-Korpus

Jens Maase, Diane Hirschfeld, Uwe Koloska, J. Helbig




Aktuelle Entwicklungen in der Messtechnik für KFZ-Freisprecheinrichtungen

F. Kettler, H. -W. Gierlich, D. Eickenhorst




Automatische Sprachverarbeitung von Funksignalen

T. Wolf




Audio-Komponenten beim e-Learning - eine erste Bestandsaufnahme

K. Fellbaum, B. Ketzmerick




Visuelle Kommunikationshilfen für Gehörlose

M. Pritsch




"Let Them Speak" - Voice technology for industrial applications - VAMP projects in Italy

M. Sartori




Application of speech technology for alarm systems and disabled persons - VAMP projects in Greece

I. Varvitsioti, T. Menexelis, N. Panagopoulos




Sprachtechnologien in der Lernumgebung eines Internet-basierten Studienganges

M. Eichner, M. Kühne, S. Werner, M. Wolff

2004




Sensing People - Localization with Microphone Arrays

Peter Noll, Markus Schwab, Wilbert Wiryadi




Ambient Intelligence - Vision und technische Lösungsansätze

Christian Hentschel




Schlüsselinnovationen, Pilotprodukte und Thesen für Sprachverarbeitung bei Wearable Computing

Astrid Ullsperger




Realisierung eines Sprachdialogsystems mit einer robusten Spracherkennung

Hans-Günter Hirsch




Revisiting some Model-Based and Data-Driven Denoising Algorithms in Aurora-2-Context

Panji Setiawan, Sorel Stan, Tim Fingscheidt




System of an Automatic Speech Recognition and Speech Understanding LINGVO/LASER

Václav Matoušek, Kamil Ekštein, Tomáš Pavelka




Stimmaktivierung eines Spracherkenners

Marco Kühne, Matthias Wolff




Flexible Decision Trees for Grapheme Based Speech Recognition

Borislava Mimer, Sebastian Stüker, Tanja Schultz




Multiquellentraining: Chancen für kleine Trainingsmengen in der automatischen Spracherkennung

Matthias Wölfel




Fehlertolerante Multimodale Fusion von N-Besten Listen von Spracheingabe und Zeitgesten

Hartwig Holzapfel, Alex Waibel




Detektion unbekannter Wörter in der automatischen Erkennung spontaner Sprache

André Berton, Olaf Schreiner




Erkennung von Sprache aus einem parametrisierten Signal mit Hilfe der digitalen Bildverarbeitung

Lukáš Džbánek, Andy Kuiper, Milan Sigmund




Domänenspezifische Optimierung eines bidirektionalen Sprachübersetzungssystems in verteilter Architektur

Michael Stier, Stefan Feldes




Bestimmung der optimalen HMM-Parameter zur robusten, phonembasierten Spracherkennung

Harald Finster, Hans-Günter Hirsch




Wiedererkennung von Audiosignalen - Verfahren und Anwendungen

Christian-M. Westendorf




Verstärkungslernen zur Prosodievorhersage in einem Sprachproduktionssystem

Markus Schnell




Voice Conversion Based on Spectral Envelope Transformation

Robert Vich, Martin Vondra




Neue Ansätze zur Sprachsynthese mit kodierten Sprachsegmenten

Guntram Strecha




Verkettung von Spracheinheiten für die Spracherzeugung mittels verlustbehafteter Rohrmodelle

Karl Schnell, Arild Lacroix




Text-to-Speech im Rundfunk - Der programmierbare Moderator?

Thomas Schierbaum




Optimierung einer trainingsbasierten Prosodiegenerierung für Sprachsynthese

Oliver Jokisch, Michael Hofmann




LexDRESS - Speech Synthesis for a Speaking Pronunciation Dictionary - First Results

Rüdiger Hoffmann, Ursula Hirschfeld, Oliver Jokisch, Lutz C. Anders




Rule Based Sounds Duration Model for the Czech TTS System

Petr Horák




Markov-Entropie basierte Auswahl geeigneter Sprachsegmente für korpusbasierte Sprachsynthese-Systeme

Christian Weiss




Analyse nasalierter Vokale unter Berücksichtigung getrennter Mund- und Nasensignale

Matthias Geueke, Arild Lacroix




Improved Time Delay Estimation Exploiting Redundancy in Microphone Arrays

Dirk Bechler, Kristian Kroschel




Modelle der Nasalierung in SPEAK

F. Ranostaj, Arild Lacroix




Integrierte multimodale Sprachdatenverwaltung mit dem WiGE System

Uwe Koloska, Diane Hirschfeld




Modellierung von Lautübergängen mittels nichtlinearer Trajektorien der Vokaltraktflächen

Karl Schnell, Arild Lacroix




Ein effektiver Algorithmus zur kombinierten Echokompensation und Geräuschreduktion in Freisprechanwendungen

Rico Petrick, Christian Gruber, Michael Fenske




Standards-based Multimodal Interface for Mobile Devices

Carsten Günther, Markus Klehr, Siegfried Kunzmann




Zum Einsatz und Nutzen elektronischer Sprachkomponenten im Wohnbereich für die Zielgruppe der älteren Menschen

Maik Hampicke




Eine mobile Interaktionsplattform für multimodale Interaktion

Giancarlo Boi, Klaus Kasper, Lubos Krejsa, Kerstin Reichel, Herbert Reininger, Bernd Schindler




Einfluss von Paketverlusten auf die Qualität von Spracherkennung und Sprachsynthese

Sebastian Möller, Jan Krebber, Alexander Raake




Mobile Informationssysteme mit integrierter Spracherkennung und Sprachsynthese

Jens Estelmann, Uwe Koloska




Robuste Spracherkennung im Cockpit von Luftfahrzeugen

Michael Dambier, Matthias Wölfel, Christian Fügen




Sprachsteuerung eines Computerspiels - Untersuchungen zur Leistungsfähigkeit und Ergonomie

Daniel Sobe, Matthias Eichner

2005




A phonetician's view of signal generation for speech synthesis

Eric Keller




Psychoacoustic experiment in the research of musical sound timbre

Jan Stepánek

2006




Sprache im Kontext sozial- und humanwissenschaftlicher Forschung

Lutz-Michael Alisch




Automatisierte Musikdatenerschließung

Meinard Müller, Frank Kurth




Zur Kommunikation bei gestörtem Hörvermögen - Möglichkeiten der technischen Unterstützung

K. Fellbaum, M. Pritsch

2007




SmartWeb - Mobile Dialogic Access to the Semantic Web

Norbert Reithinger




Sinn und Unsinn von akustischen Komponenten: Einsatz von akustischen Komponenten in Medien

Andrea Rögner




Comparison and Analysis of the Susceptibility of Wideband and Telephone-band Speech to Various Environmental Additive Noise Sources

Deepa Janardhanan, Ulrich Heute




Evaluation of Vocal-Facial Based Emotion Primitives

Kristian Kroschel, Michael Grimm, Vasilije Krstanovic




Zur auditiven und apparativen Charakterisierung von Stimmen

Bettina Ketzmerick




Einkanalige Störgeräuschunterdrückung zur Steigerung der Worterkennungsrate eines Spracherkenners

Sören Wittenberg, Rico Petrick, Matthias Wolff, Rüdiger Hoffmann




Unterstützende Sprachübersetzung in Telefonkonferenzen

Martin Eckert, Stefan Feldes, Karlheinz Schuhmacher, Ralf Kirchherr, Joachim Stegmann, Florian Metze




Gender Recognition and Gender-based Acoustic Model Adaptation for Telephone-based Spoken Dialog System

Kinfe Tadesse Mengistu, Martin Schafföner, Andreas Wendemuth




Czech Explanatory Dictionary and its Computer Implementation

Václav Matoušek, Jana Michalicová, Roman Mouček




Vergleichende Untersuchungen zur Erkenngenauigkeit Pitch-kohärenter Merkmale bei verschiedenen Störgeräuschen unter Verwendung der Aurora-2-Datenbasis

Ronald Römer, Raymond Brückner




Eine Datenbank für Untersuchungen zur Sprecheridentifikation und Sprecherverifikation

Stephan Euler, Christian Pilz




LDec: One Pass Time Synchronous Decoder

Tomás Pavelka, Václav Matoušek




HSVM - A SVM Toolkit for Segmented Speech Data

André Stuhlsatz




KorpusDress1 - Korpusbasierte konkatenative Sprachsynthesesysteme

Hamurabi Gamboa Rosales, Oliver Jokisch




Ein zeitvariabler linearer Prädiktionsalgorithmus für die Sprachverarbeitung

Karl Schnell, Arild Lacroix




Adaptive Comb Filtering in Speech Enhancement by Spectral Subtraction

Martin Vondra, Robert Vich




ASR Failure Prediction Based on Signal Measures

Lu Huo, Ulrich Heute




Richtmikrofon mit digitaler Signalverarbeitung

Dietmar Richter




SNR-Based Assessment of Quality of Speech Enhancement Using Single-Channel Methods

Zdenek Smékal, Robert Vich




How to Access Large Navigation Databases in Cars by Speech

André Berton, Sandra Mann, Peter Regel-Brietzmann




Personalisierte Sprachinteraktion zur Priorisierung von Internet-Informationen im Auto

Philipp Fischer, André Berton, Peter Regel-Brietzmann




Ein interaktives Tutorial für ein Sprachbediensystem im Fahrzeug

Franziska Höhne, Bärbel Jeschke, Klaus Fellbaum




Design von Sprachdialogen für das KFZ - Stand der Technik

Bärbel Jeschke




Akustische Echtzeitnachbildung eines Fahrzeuginnenraums und einer fernen Gegenstelle

Mohamed Krini, Samuel Ngouoko, Gerhard Schmidt




A Multimodal Dialogue System for Interacting with Large Audio Databases in the Car

Sandra Mann, André Berton, Ute Ehrlich




Wahrgenommene Sprachqualität in Telefongesprächen bei zeitlich variierenden Übertragungseigenschaften

Benjamin Weiss, Sebastian Möller, Jens Berger




Broker-Software zur generischen Realisierung multimodaler Applikationen auf konventionellen Sprachplattformen

Michael Buschbeck, Klaus Kasper, Herbert Reininger, Lubos Krejsa, Martin Wagner, Sven Lehnen, Matthias Thiel, Lars Both




Ein taktil-akustischer Plan eines Liniennetzes für blinde Personen

Peggy Nachtigall, Klaus Fellbaum




Untersuchungen zeitskalierter Sprachwiedergabe mit normal sehenden, sehbehinderten und blinden Probanden

Dirk Höpfner




Support Vector Machines - Eine Einführung

Steffen Werner

2008




Experimente zum Übertragungsverhalten Mareyscher Kapseln

Dieter Mehnert, Rolf Dietzel, Dietmar Richter, Jürgen Landgraf




Experimente mit dem Teager Energie Operator

Robert Vich, Martin Vondra




Analysis of PARADISE Models for Individual Users of a Spoken Dialog System

Klaus-Peter Engelbrecht, Sebastian Möller, Robert Schleicher, Ina Wechsung




Gemeinsamkeiten und Unterschiede in den Aussagen von Versuchspersonen in Einschätzungstests

Erwin Paulus




Robust Sound Source Identification for a Humanoid Robot

Alexej Swerdlow, Timo Machmer, Benjamin Kühn, Kristian Kroschel




Früherkennung von Hörstörungen durch objektive Hördiagnostik

Mario Cebulla




Towards User Group Dependent Acoustic Models

Kinfe Tadesse Mengistu, Andreas Wendemuth




Semantic Range of Spoken Dialogue Systems

Roman Mouéek, Miloslav Konopik




Was möchten Sie hören? - Zielsicheres Suchen in großen Datenmengen mit integrierten multimodalen Systemen

Marcel Dausend, André Berton, Alfred Kaltenmeier, Sandra Mann




Towards Semantic Analysis of Spoken Queries

Miloslav Konopik, Václav Matoušek, Roman Mouček




Untersuchungen zur automatisierten Umsetzung von Sprachdialogen mittels eines Model-Driven-Ansatzes

Thomas Langholz, Klaus Kasper, Michael Buschbeck, Herbert Reininger, Kerstin Sehnert




Sprachgestützte multimodale Navigation in einem Videoportal auf mobilen Endgeräten

Christian Weiß, Stafan Feldes, Thomas Kremer, Karlheinz Schuhmacher, Ralf Kirchherr, Joachim Stegmann, Ina Wechsung, Anja Naumann




"Beethoven's Ninth" - An Experiment on Naming Usage for Audio Files

Sandra Mann, André Berton, Marcel Dausend, Paul Heisterkamp




The EURONOUNCE Project — An Intelligent Language Tutoring System with Multimodal Feedback Functions: Roadmap and Specifications

O. Jokisch, R. Jäckel, M. Rusko, G. Demenko, N. Cylwik, A. Ronzhin, D. Hirschfeld, U. Koloska, L. Hanisch, R. Hofmann




Erweiterung eines HMM - basierten Spracherkennungssystems für die Zustandsüberwachung beweglicher Maschinenteile

S. Wittenberg, R. Hoffmann




Multilingual Acoustic Features for Porting Speech Recognition Systems to New Languages

S. Stüker




Verbesserung der automatischen Transkription von englischen Wörtern in deutschen Vorlesungen

S. Ochs‚ M. Wölfel, S. Stüker




Adaptation of Frequency Band Influence for Non-Native Speech Recognition

M. Raab, T. Herbig, R. Brueckner, R. Gruhn, E. Nöth




Ein zeitvariabler Burg-Algorithmus für die Sprachanalyse

K. Schnell, A. Lacroix




Evaluation of Automatic Speech Emotion Recognition Based on Gaussian Mixture Models

M. Vondra, R. Vich




Advances in Anger Detection with Real Life Data

F. Burkhardt, R. Huber, J. Stegmann




Signalbearbeitung und Erweiterung durch externe Module im Programm FBview

S. Euler




Einfluss der Pitchmarkierung auf die Qualität der konkatenativen Sprachsynthese

H. Gamboa Rosales




Nichtlinearer Zeitskalierungsalgorithmus für gespeicherte natürliche Sprache

D. Höpfner




Einzelfallstudie zu Grenzen der Verständlichkeit ultra-schneller Sprachsynthese

A. Moos, J. Trouvain




Phonetic Analysis and Redesign Perspectives of Artificial Speech Bandwidth Extension

P. Bauer, T. Fingscheidt, M. Lieb




Noise Reduction with Adaptive Maximum Attenuation

M. Krini, G. Schmidt




Speaker Localization - Novel Algorithm and Practical Aspects

N. Madhu, D. Oswald, R. Martin




Independent Component Analysis (ICA)

M. Eichler

2009




Semantische Dialogmodellierung mit gewichteten Merkmal-Werte-Relationen

Markus Huber, Christian Kölbl, Robert Lorenz, Ronald Römer, Günther Wirsching




Konzeptionelle Beschreibung des cortikalen Algorithmus und seine Anwendung in der Automatischen Sprachverarbeitung

Ronald Römer, Tobias Herbig




Merkmalsextraktion für die Spracherkennung

Christian Lüke, Karl Schnell




Example-based Realization of Isolated Words Recognizer under Limited Training Data Constraint

Petr Zelinka, Milan Sigmund, Detlef Richter




Ein echtzeitfähiges Verfahren zur Erkennung von Babyschreien

Renán Véliz, Stefan Feldes




Grammar-based Dialogue Management Techniques

Václav Matoušek, Tomáš Nestorovič




Sprachsteuerung für mobile ortsbasierte Internet-Dienste

Carsten Günther, Mathias Jöst, Marion Mast, Markus Klehr




Modellbasierte Generierung von Sprachdialogen für eingebettete Systeme

Uwe Koloska, Matthias Pohl




Ein Sprachdialogsystem mit begrenzten Hardwareressourcen

Frank Duckhorn, Guntram Strecha, Matthias Wolff, Rüdiger Hoffmann




AvatR – Audio visual assistant turns Real

Robert Granich, Herwig Weidle, Toni Homuth, Niels Baumbach




Von der Schmalband-Telefonie zur Mobilen Audio-Kommunikation

Peter Vary




Nichtkausales cepstrales Sprachmodell

Robert Vích




Evaluation of Information Contained in Spectral Features

Harald Höge, Panji Setiawan




Kombinierte Ansätze zeitvariabler und zeitinvarianter Modellanalysen für die Sprachverarbeitung

Karl Schnell, Arild Lacroix




Dereverberation of Speech Signals Based on the Discrete Model of Speech Production

Marco Jeub, Peter Vary




Mehrkanaliges akustisches Front-End für Spracherkennungssysteme

Thomas Fehér, Rico Petrick, Rüdiger Hoffmann




Modellbasierte Verbesserung von Sprachverständlichkeit in Hörgeräten

Anton Schlesinger, Marinus M. Boone




Multi-Channel Speech Enhancement for Car Applications

Huajun Yu, Tim Fingscheidt




RTPROC: Rapid Real-time Prototyping for Audio Signal Processing

Hauke Krüger, Thomas Schumacher, Thomas Esch, Bernd Geiser, Peter Vary




Extending Monaural Speech and Audio Codecs by Inter-Channel Linear Prediction

Magnus Schäfer, Hauke Krüger, Peter Vary




Implementation of a Superdirective Beamformer based on an Extended Modal Subspace Decomposition

Martin Eichler, Arild Lacroix




Artikulatorische Sprachsynthese

Bernd J. Kröger, Peter Birkholz




Emotional Speech Synthesis: Applications, History and possible Future

Felix Burkhardt, Joachim Stegmann




Applications of HMMs for the Recognition of Emotional Sequences in the Valence-Arousal Space

David Hübner, Ronald Böck, Andreas Wendemuth




On the Influences of Feature Extraction in Single Emotion Recognition in Naive vs. Acted Speech

Ronald Böck, David Hübner, Andreas Wendemuth




Multilingual Voice Analysis: Towards Prosodic Correlates of Voice Preference

Horst-Udo Hain, Oliver Jokisch, Luis Coelho




Russian Text-to-Speech Synthesis System for Mobile Telephones

Liliya Tsirulnik, Dmitry Pokladok




Evaluation of F0 Stylisation Methods and Fujisaki-Model Extractors

Hartmut R. Pfitzinger, Hansjörg Mixdorff




Parameter estimation and prediction from text for a superpositional intonations model

Humberto M. Torres, Jorge A. Gurlekian




Sprachtechnologie zur Unterstützung von Menschen mit Sinnesbehinderungen

Klaus Fellbaum




Einsatz von Sprachanwendungen im Ambient Assited Living (AAL) – Rückblick, aktueller Stand und Zukunftsperspektive

Maik Hampicke




Nachbildung von Störungen der Hör- und der Sehbahn für Studien an technischen Kommunikationshilfen

Sermed Al-Hamdani, Hans-Heinrich Bothe




Verstehbarkeits-Untersuchung synthetisch geglätteter Intonationsstrukturen in zeitskalierter Sprache

Dirk Höpfner




SignSpeak - Bridging the gap between signers and speakers

Philippe Dreuw, Hermann Ney




Zur Kommunikation zwischen Gehörlosen und Normalhörenden

Jens Lindemann




Barrierefreies Informieren und Kommunizieren mittels Spracherkennung

Christiane Berndt, Rainer G. Spallek




Sprachqualität in drahtlosen Next Generation Networks - Einflüsse von Netzwechseln im Konversationsversuch

Sebastian Möller, Niklas Kirschnick, Blazej Lewcio, Pablo Vidales, Marcel Wältermann




Speech Quality of wideband VoIP under packet loss

Alexander Raake, Marcel Wältermann, Nicolas Côté, Sebastian Möller




Vollduplex-Kommunikation in Kiosk- und Konferenzsystemen

Christian Gruber




Sprachsynthesesysteme für den Einsatz im KFZ - Untersuchungen zur Sprachqualität

Nadya Stoyanova, Steffen Werner




Signalbasierte musikalische Ähnlichkeitssuche im Praxiseinsatz

Matthias Eichner, Dirk Schönfuß




Vergleich statistischer Klassifikatoren zur Ermittlung musikalischer Aspekte

Stephan Hübler, Matthias Wolff, Matthias Eichner




Beurteilung von Klavieren anhand messtechnisch gewonnener Merkmale

Gunter Ziegenhals




Development of a Computer-Aided Language Learning Environment for Mandarin – First Steps

Hansjörg Mixdorff, Daniel Külls, Hussein Hussein




Lexikalische Modellierung fremdsprachlicher Akzente – Methoden, Möglichkeiten und Grenzen eines regelbasierten Ansatzes

Stefan Schaden




Training of HMMs for Pronunciation Error Detection – Crosslingual Bootstrapping vs. Flatstart Training

Michael Beilig, Diane Hirschfeld, Oliver Jokisch, Uwe Koloska




Kontrastive Untersuchung zur Realisierung der Fokusakzente in gelesenen Äußerungen (am Beispiel der Sprachenpaarung L1 Russisch – L2 Deutsch)

Rainer Jäckel, Hussein Hussein




An investigation of the pronunciation of English words in German sms texts

Hongwei Ding, Oliver Jokisch

2010




On the Alignment of Prosodic Events

Hansjörg Mixdorff




Early Experiments on Prosody in Synthetic Speech

Rüdiger Hoffmann, Dieter Mehnert




In Search of Models — A Review of the Author’s Research over a Half Century

Hiroya Fujisaki




Shifting the Paradigm from Source-Filter-Modelling to Segmental-Suprasegmental Modelling of Speech.

Hartmut R. Pfitzinger




An Action-Based Concept for the Phonetic Annotation of Sign Language Gestures

Bernd J. Kröger, Jim Kannampuzha, Dominik Bauer, Peter Birkholz, Philippe Dreuw, Hermann Ney




Speech, Gaze and Head Motion in a Face-to-Face Collaborative Task

Sascha Fagel, Gerard Bailly




Maschinelle Klassifikation von Artikulationsbewegungen im Rahmen einer visuellen Artikulationsschulung für gehörlose und schwerhöriger Kinder

Ralf Winkler, Gunter Uhlmann, Gerd Schneider




Wirkung menschlicher Stimme auf die wahrgenommene Sympathie- Einfluss der Stimmanregung anhand von Laryngogrammen

Benjamin Weiss, Sebastian Möller, Tim Polzehl




Affektäußerungen in Sprachkorpora

Jürgen Trouvain




Das Prosodisch-Phonetische Annotationssystem PROPHANO

Sören Wittenberg, Oliver Jokisch




Accent Command Model. Parameter Alignment in Argentine Spanish Absolute Interrogatives

Jorge Gurlekian, Diego Evin, Hansjörg Mixdorff, Humberto Torres, Hartmut Pfitzinger




Using FO Contour Generation Process Model for Improved and Flexible Control of Prosodic Features in HMM-based Speech Synthesis

Keikichi Hirose, Keiko Ochi, Miaomiao Wang, Tatsuya Matsuda, Miaomiao Wen, Nobuaki Minematsu




Ein interdisziplinäres: Stimmkonzept

Katrin Hannappel, Nils Ülzmann, Hartmut R. Pfitzinger




Instrumental Evaluation of Synthesized Speech Quality

Sebastian Möller, Florian Hinterleitner




Acoustics vs. articulation in articulatory speech synthesis: One vocal tract target configuration has more than one sound

Eva Lasarcyk




Speech Conversion Using a Mixed-phase Cepstral Vocoder

Martin Vondra, Robert Vich




Erzeugung schneller Sprache mittels Unit Selection Sprachsynthese

Donata Moers, Petra Wagner, Bernd Möbius




Phoneme-to-phoneme alignment and conversion

Uwe D. Reichel, Raphael Winkelmann




Laufzeitoptimierte Geräuschreduktionsverfahren basierend auf overlap-save-Strukturen mit Projektionsfilternäherungen

Arthur Wolf, Bernd Iser, Gerhardt Schmidt




Enthallung und Trennung von Sprachsignalen mittels blinder adaptiver MIMO-Filterung

Herbert Buchner




Cortical Algorithm for Symbolic and Sub-symbolic Applications

Ronald Römer




Reducing the Complexity or the Delay of Adaptive Subband Filtering

Patrick Hannon, Mohamed Krini, Gerhard Schmidt, Arthur Wolf




Laufzeitmessung von gestörten akustischen Signalen mit Verfahren der Mustererkennung

Ulrich Kordon, Matthias Wolff, Steffen Kürbis




Entwicklung und Performance eines Sprachdialogsystems mit begrenzten Hardwareressourcen

Frank Duckhorn, Guntram Strecha, Matthias Wolff, Rüdiger Hoffmann




Herausforderungen an Sprachinterfaces für Kinder

Karina Matthes, Felix Claus, Horst-Udo Hain, Rico Petrick




Identifikation von Interaktivitätsmustern zur regelbasierten Usability- Evaluierung von Sprachdialogsystemen

Stefan Schmidt, Matthias Schulz, Martin Meister, Julian Stubbe, Mandy Töppel, Klaus-Peter Engelbrecht, Sebastian Möller




Akustisches und mobiles Front-End für ein Public Terminal

Thomas Fehér, Sören Wittenberg, Rüdiger Hoffmann




InproTK in Action: Open-Source Software for Building German-Speaking Incremental Spoken Dialogue Systems

Timo Baumann, Okko Buß, David Schlangen




Voice and Graphical User Interfaces: Design Issues

Tomáš Nestorovič




Improvements of Hidden Chunk Models

Harald Höge, Panji Setiawan




Evaluation of Automatic Speaker Recognition Approaches

Pavel Král, Václav Matoušek




N-Best Rescoring based on Intonation Prediction for a Spanish ASR System

Diego Evin, Jorge Gurlekian, Humberto Torres




Improving speech interaction in vehicles using context-aware information through an SCXML framework

Álvaro Sigüenza, José Luis Blanco, David Conejero, Luis Hernández




Schnelle Entwicklung von Sprachdialogen mit dem Framework GRAILS

Stephan Euler




Mobile Office and Entertainment System Based on Android

Felix Burkhardt, Martin Eckert, Julia Niemann, Frank Oberle, Thomas Scheerbarth, Stefan Seide, Jianshen Zhou




Mixed-Type-Multi-Class Audio Klassifikation und Segmentation für die Inhaltserfassung von Broadcast Medien

Katja Madany




Human Speech Model based on Information Separation

Nobuaki Minematsu




Pronunciation of German Syllable Codas of Mandarin Chinese Speakers

Hongwei Ding, Hansjörg Mixdorff, Oliver Jokisch




Development of a Computer-Aided Pronunciation Training System for Teaching Mandarin for German Learners — Pronunciation Errors

Hussein Hussein, Hansjörg Mixdorff, Hue San Do, Si Wei, Oianyong Gao, Shu Gong, Hongwei Ding, Guoping Hu




Computational Modeling of Timing Control and its Application to Objective Evaluation of the Second Language Proficiency

Yoshinori Sagisaka, Hiroaki Kato, Minoru Tsuzaki, Shizuka Nakamura, Chatchawarn Hansakunbuntheung




Pitch Pattern Recognition of Isolated Words for the Development of a Japanese Language Call System

Greg Short, Keikichi Hirose, Nobuaki Minematsu

2011




A survey of self-oscillating lumped-element models of the vocal folds

Peter Birkholz




Dual channel reduction of rapidly varying harmonic and random noise using a spot microphone

Florian Heese, Thomas Esch, Peter Vary




Evaluation of single- and dual-channel noise power spectral density estimation algorithms for mobile phones

Christian Herglotz, Marco Jeub, Christoph Nelke, Christophe Beaugeant, Peter Vary




The impact of correlated features in speech recognition

Harald Höge




Speechalyzer: a software tool to process speech data

Felix Burkhardt




Deeper insights into the role of Broca’s region in language processing by connectivity analysis

Stefan Heim, Simon B. Eickhoff




Prominenzbasierte Prosodieprädiktion für die Unit-Selection-Sprachsynthese

Andreas Windmann, Igor Jauk, Fabio Tamburini, Petra Wagner




Towards a better understanding of TTS Synthesis: Subjective quality and its instrumental assessment

Christoph Norrenbrock, Florian Hinterleitner, Ulrich Heute, Sebastian Möller




Predicting the quality of synthesized speech using reference-based prediction measures

Florian Hinterleitner, Steve Zabel, Sebastian Möller, Lutz Leutelt, Christoph Norrenbrock




Was soll(t)en wir mit Sprachdatenbanken anfangen?

Bernd Pompino-Marschall




Sex-specific differences in vowel undershoot. Consequences for the perception of clarity and tempo

Adrian P. Simpson




On the application of psychoacoustically-motivated dereverberation for recordings taken in the German parliament

Marco Jeub, Peter Vary




Quality of network based acoustic noise reduction

Matthias Pawig, Peter Vary




Near end listening enhancement considering thermal limit of mobile phone loudspeakers

Bastian Sauert, Peter Vary




The CoPaSul intonation model

Uwe D. Reichel




Performanzuntersuchungen zur Stimmkonvertierung

Oliver Jokisch, Hamurabi Gamboa Rosales




Die Lokalisation von sprachlichen und kognitiven Prozessen im fMRT Interferenzparadigma

Stefanie Abel




Development of automatic Amharic speech recognizer

Yitagessu Birhanu Gebremedhin, Rüdiger Hoffmann




The lexicon-syllabary model: Evidence from imaging studies

Cornelia Eckers, Stefan Heim, Bernd J. Kröger




Binaural wideband telephony using steganography

Bernd Geiser, Magnus Schäfer, Peter Vary




The computational architecture of Elija: a model of a young child that learns to pronounce

Ian S. Howard, Piers Messum




Comparison of Fujisaki-model parameters between German Learners and native speakers of Mandarin

Hussein Hussein, Hansjörg Mixdorff, Hue San Do, Marijo Mateljan, Qianyong Gao, Guoping Hu, Si Wei, Zhao Chao




Training einer sich selbst organisierenden Karte im neurobiologischen Sprachverarbeitungsmodell MSYL

Jim Kannampuzha, Cornelia Eckers, Bernd J. Kröger




Evaluierung der Leistungsfähigkeit von Spracherkennungssystemen in Geräten der Kommunikationstechnik

Andreas Kitzig, Hans-Günter Hirsch




Is there an otoacoustic fingerprint?

Peter Knopp




Endliche gewichtete Transduktoren als semantischer Träger

Christian Kölbl, Markus Huber, Günther Wirsching




Neurobiological interpretation of a quantitative target approximation model for speech actions

Bernd J. Kröger, Peter Birkholz, Jim Kannampuzha, Cornelia Eckers, Emily Kaufmann, Christiane Neuschaefer-Rube




Beyond vocal tract actions: speech prosody and co-verbal gesturing in face-to-face communication

Bernd J. Kröger, Peter Birkholz, Emily Kaufmann, Christiane Neuschaefer-Rube




A fast indexing method for shells of the gosset lattice

Hauke Krüger, Bernd Geiser, Peter Vary, Haiting Li, Deming Zhang




Combined analog/digital broadband feedback ANC for headsets

Hauke Krüger, Thomas Schumacher, Marco Jeub, Peter Vary




Schnell gesprochene Sprache als Einheiten-Auswahl-Inventar in der Unit-Selection-Sprachsynthese

Donata Moers




Robust continuous speech recognition through combination of invariant-feature based systems

Florian Müller, Alfred Mertins




A listening test environment for subjective assessment of speech and audio signal processing algorithms

Magnus Schäfer, Christopher Schnelling, Bernd Geiser, Peter Vary




Progress in animation of an EMA-controlled tongue model for acoustic-visual speech synthesis

Ingmar Steiner, Slim Ouni




Zur Wahrnehmung von manipuliertem Weinen als Lachen

Jürgen Trouvain




Wahrnehmungsdimensionen von Stimme und Sprechweise

Benjamin Weiss, Sebastian Möller




Gehörrichtige Geräuschanalyse nichtsprachlicher akustischer Signale in der Mustererkennung

Sören Wittenberg




Forensisch-phonetischer Stimmenvergleich

Angelika Braun




Vom Hören zum Verstehen: Sprach- und Signalverarbeitung in Hörgeräten und Cochlea-Implantat-Systemen

Wolfgang H. Döring




Tubenfunktionsprüfung mit Methoden der digitalen Sprachsignalverarbeitung

Aulis Telle, Peter Vary




Stimm-Messungen mit einem Beschleunigungssensor am Kehlkopf

Wolfgang Wokurek




Experimentelle Ansätze zur Schlagzeuganalyse in Musiksignalen

Stephan Hübler, Rüdiger Hoffmann




Zur Logik von Bestenlisten in der Dialogmodellierung

Günther Wirsching, Christian Kölbl, Markus Huber




Die Architektur artikulatorischer Pläne: Neurophonetische Evidenz

Wolfram Ziegler




Beschreibung von Analyse-Synthese-Systemen unter Verwendung von kaskadierten bidirektionalen HMMs

Ronald Römer




Modelling caregiver tutored development of pronunciation in a young child

Ian S. Howard, Piers Messum




Exemplarbasierte Sprachproduktion und Unit Selection-Synthese

Bernd Möbius




Wie relevant ist die Phonetik noch für die Sprachsynthese?

Petra Wagner

2012




Die rätselhafte Fähigkeit des Gehirns, Sprache ohne Hilfe von neuronalen Codes zu verarbeiten

Wolfgang Hilberg




Nichtsequentialität in der Sprachverarbeitung mit FST

Günther Wirsching




Benutzermodell zur Simulation von Interaktionen mit Sprachdialogsystemen basierend auf Aktivierung von Teil-Zielen

Klaus-Peter Engelbrecht




The Use of Conditional Gaussians for Hidden Chunk Models

Harald Höge




Automatische Zeichensetzung in Spracherkennungssystemen: Entscheidungsbaum und Sprachmodell im Vergleich

Heike Adel, Kevin Kilgour, Sebastian Stüker, Alex Waibel




Investigation of hierarchical classification for simultaneous gender and age recognition

Ingo Siegert, Ronald Böck, David Philippou-Hübner, Andreas Wendemuth




Continuous speech recognition using Correlation features and structured SVM probability output

Andreas Beschorner, Dietrich Klakow




Multi-condition Training and Adaptation for Noise Robust Speech Recognition

Ivan Kraljevski, Frank Duckhorn, Matthias Wolff, Rüdiger Hoffmann




Zum Einsatz von Elektroenzephalographie bei der Messung der Wahrnehmung gestörter Sprache

Sebastian Möller, Jan-Niklas Antons, Sebastian Arndt, Anne K. Porbadnigk, Robert Schleicher




A new artificial palate design for the optical measurement of tongue and lip movements

Peter Birkholz, Christiane Neuschaefer-Rube




How does the Brain recognize speech - Modelling using hierarchical recurrent neural networks

Stefan J. Kiebel, Burak I. Yildiz




Konfidenzberechnung für automatische Labels

Frank Duckhorn, Rüdiger Hoffmann




On the Use of Fujisaki Parameters for the Quality Prediction of Synthetic Speech

Florian Hinterleitner, Christoph Norrenbrock, Sebastian Möller




Zur Formulierung von Hidden-Markov-Modellen als endliche Transduktoren

Constanze Tschöpe, Matthias Wolff




Algorithmen zur Störgeräuschunterdrückung für differentielle Mikrofonanordnungen

Thomas Fehér, Rüdiger Hoffmann




Probabilistic induction of metrical trees for word stress assignment

Uwe D. Reichel




Postvokalische /r/ Realisierung in Erst- und Zweitsprache

Christiane Ulbrich, Horst Ulbrich




A Preliminary Investigation of Tense-Lax Contrast of German Vowels by Chinese Learners

Hongwei Ding, Oliver Jokisch




Hierarchische kognitive dynamische Systeme zur Sprach- und Signalverarbeitung

Matthias Wolff, Ronald Römer, Rüdiger Hoffmann




’Ja, mhm, ich verstehe Dich’ – Oszillator-basiertes Timing multimodaler Feedback-Signale in spontanen Dialogen

Petra Wagner, Benjamin Inden, Zofia Malisz, Ipke Wachsmuth




Entwicklung von Dialogstrategien zur Sprachbedienung von Web Transactions im Fahrzeug

Hansjörg Hofmann, Anna Silberstein, Ute Ehrlich, André Berton, Anja Naumann, Sebastian Möller




Qualitätssicherung im Linguatronic Entwicklungsprozess – Modellbasiertes Testen auf Basis formaler Beschreibung von Sprachdialogsystemen

Lars Lütze, Dr. Steffen Werner




Untersuchungen zur Güte der Simulation einer Spracheingabe im Freisprechmodus bei der Evaluierung von Spracherkennungssystemen

Andreas Kitzig, Hans-Günter Hirsch




Zum Stand der Technik im automatischen Erkennen von Kindersprache

Felix Claus, Rico Petrick, Horst-Udo Hain




Combining Mimic and Prosodic Analyses for User Disposition Classification

Ronald Böck, Kerstin Limbrecht, Ingo Siegert, Stefan Glüge, Steffen Walter, Andreas Wendemuth




Applying the speaking rate in a hierarchical classifier for emotion recognition from speech

David Philippou-Hübner, Ronald Böck, Andreas Wendemuth




Vergleich der Produktionsgeschwindigkeit von Laut- und Gebärdensprache

Jens Lindemann




Untersuchungen zum Cortikalen Algorithmus unter Verwendung von Bidirektionalen HMMs

Ronald Römer




Hidden Markov Model based Amharic Speech Synthesizer

Yitagessu Birhanu, Guntram Strecha, Rüdiger Hoffmann




Aspekte von Sympathie: Gesprächsstruktur und Gesprächsanteil

Benjamin Weiss, Katrin Schoenenberg




Semantic, Phonetic, and Phonological Knowledge in a Neurocomputational Model of Speech Acquisition

Cornelia Eckers, Bernd J. Kröger




Gestörte akustische Umgebungen und ihr Einfluss auf netzbasierte auditive Testverfahren

Christian Richter, Tobias Holfeld




Signalphonetische Untersuchung der Obstruentenfolgen an Wortfugen in gelesenen Äußerungen russischer und tschechischer Deutschlerner

Rainer Jäckel




Mutmaßungen über Kognition

Klaus Fellbaum




Petri Net Tranducers in Semantic Dialogue Modelling

Markus Huber, Robert Lorenz




FeVaRFiStTr - Algorithmische Kommutativität zwischen gewichteten Merkmal- Werte-Relationen und endlichen gewichteten Transduktoren in ihrer Funktion als semantische Träger

Niclas Geiger, Markus Huber, Christian Kölbl, Moritz Laudahn, Rupert Reutner-Hammelmeir, Frowin Ziegler




Semantische Modellierung von System-Benutzer-Interaktionen am Beispiel einer Home-Entertainment Steuerung

Kathleen Karnagel, Ronald Römer, Stephan Rogge, Jens Lindemann




Semantische Modellierung eines Virtual Reality Systems mit Gestensteuerung

Stephan Rogge, Ronald Römer, Christian Hentschel




A Pronunciation Tutoring System for Basque - First Development Steps

Igor Odriozola, Oliver Jokisch, Inma Hernáez, Rüdiger Hoffmann




Realisierung eines Smartphone-basierten auditiven Feedbacks zur unterstützenden Stotterbehandlung

Jürgen Hock, Stefan Feldes




Gut und günstig? Nutzung des Google Speech API in Sprachdialogsystemen

Stefan Schmidt




HMM-Based Mandarin Tone Recognition - Application in Computer-Aided Language Learning System for Mandarin

Hussein Hussein, Hansjörg Mixdorff, Yuan-Fu Liao, Rüdiger Hoffmann




Beurteilung von Metallblasinstrumenten auf der Basis messtechnisch gewonnener Merkmale

Gunter Ziegenhals

2013




Incremental Speech and Language Processing

David Schlangen




Using Affordances to shape the interaction in a hybrid spoken dialogue system

Timo Baumann, Maike Paetzel, Philipp Schlesinger, Wolfgang Menzel




Aufgabenmodellierung in der Simulation von Interaktionen mit Sprachdialogsystemen

Stefan Hillmann, Klaus-Peter Engelbrecht




Herausforderungen der kombinierten Verwendung von On-Board- und Off-Board- Sprachdialogsystemen in Telematikeinheiten im Automobil

Maria Schmidt, Steffen Werner, Tobias Heinroth




Semantische Anwendungsmodellierung und Nutzermodelle: Anforderungen an einen sprachlich zu bedienenden persönlichen Assistenten im dynamischen Systemumfeld

Sven Reichel, André Berton, Ute Ehrlich, Michael Weber




Perceptual quality dimensions of Text-to-Speech systems in audiobook reading tasks

Florian Hinterleitner, Christoph Norrenbrock, Sebastian Möller




Einatmungsgeräusche vor synthetisch erzeugten Sätzen: Eine Pilotstudie

Jürgen Trouvain, Bernd Möbius




Informationsstruktur in der Sprachsynthese: Früher Fokus und postfokale Gegebenheit

Frank Kügler, Bernadett Smolibocki, Manfred Stede, Sebastian Varges




How to learn proto speech patterns using a physiologically based vocal tract model

Bernd J. Kröger, Xi Chen, Cornelia Eckers, Stefan Heim




Contribution of timing patterns into perceived foreign accent

Leona Polyanskaya, Mikhail Ordin, Christiane Ulbrich




A preliminary investigation of German rhythms by Chinese learners

Hongwei Ding, Rainer Jäckel, Rüdiger Hoffmann




Modeling multi-modal factors in speech production with the context-sequence model

Daniel Duran, Jagoda Bruni, Grzegorz Dogil




Ein Beitrag zu den Natur- und geisteswissenschaftlichen Grundlagen kognitiver Systeme

Ronald Römer, Günther Wirsching, Matthias Wolff




Realising the Translation of Utterances into Meanings by Petri Net Transducers

Robert Lorenz, Markus Huber




Konstruktion von UMP-Transduktoren aus Wizard-of-Oz Daten

Markus Huber, Christian Kölbl, Robert Lorenz, Günther Wirsching




Elektromyographische Analyse von Sprech- und Schluckbewegungen

Peter Birkholz




Voice enabling the AutoScout24 Car Search App

Felix Burkhardt, Jianshen Zhou, Stefan Seide, Thomas Scheerbarth, Bernd Jäkel, Tilman Buchner




The speech action repository: Evidence from a single case neuroimaging study

Cornelia Eckers, Bernd J. Kröger, Stefan Heim




Phonetic analysis vs. dirty signals: Fixing the paradox

Tina John, Oliver Niebuhr, Gerhard Schmidt, Anne Theiß




Prospects of EPG and OPG sensor fusion in pursuit of a 3D real-time representation of the oral cavity

Simon Preuß, Christiane Neuschaefer-Rube, Peter Birkholz




TextGridTools: A TextGrid Parsing and Analysis Toolkit

Hendrik Buschmeier, Marcin Włodarczak




A dialect distance metric based on string and temporal alignment

Thomas Kisler, Uwe D. Reichel




Differences between speakers in audio- vs. visual classification of word prominence

Martin Heckmann




Cross-cultural recognition of auditive feedback with echo state networks

Anja K. Philippsen, Kai A. Mismahl, Britta Wrede, Yukie Nagai




Alignment between rigid head movements and prosodic landmarks

Angelika Hönemann, Hansjörg Mixdorff, Sascha Fagel




Progress in facial expression based affective speech translation

Zeeshan Ahmed, Ingmar Steiner, Éva Székely, Julie Carson-Berndsen




Subsymbol-Symbol-Transduktoren

Matthias Wolff, Constanze Tschöpe, Ronald Römer, Günther Wirsching




Anwendungen der akustischen Mustererkennung

Constanze Tschöpe, Matthias Wolff, Rüdiger Hoffmann




Phonetics and Phonology of Interaction

Petra Wagner




Prosodische Elemente vokaler Sympathie

Benjamin Weiss




Second-degree polynomial model of Mandarin Chinese Lexical Tone F0 Contours

Tomasz Kuczmarski, Danien Duran, Norbert Kordek, Jagoda Bruni




Parameterization of F0 register and discontinuity to predict prosodic boundary strength in Hungarian spontaneous speech

Uwe D. Reichel, Katalin Mády




Improved phoneme segmentation of German-accented English by means of lexicon and acoustic model adaptation

Maria Paola Bissiri, Ivan Kraljevski, Rüdiger Hoffmann




Text independent speaker identification with coded speech

Ivan Kraljevski, Maria Paola Bissiri, Rüdiger Hoffmann




Predictability of the effects of phoneme merging on speech recognition performance by quantifying phoneme relations

Lia Saki Bucar Shigemori, Uwe Reichel




Comparison of HMMs and HCMs

Harald Höge

2014




Wozu eigentlich Schall? Vom Hören zur akustischen Gestaltung der Welt.

Friedrich E. Blutner




Was kommt nach dem Schall? - Experimente und Modalanalysen zum Hören

Marcus Neudert, Matthias Bornitz, Thomas Beleites, Thomas Zahnert




Building Segments with Chunks

Harald Höge




Ein Multiskalen Analyse-System unter Verwendung von kaskadierten bidirektionalen Hidden Markov Modellen

Ronald Römer




Tuning Sphinx to outperform Google’s speech recognition API

Patrick Lange, David Suendermann-Oeft




Language-independent grapheme-phoneme conversion and word stress assignment as a web service

Uwe D. Reichel, Thomas Kisler




Studie zur Anwendbarkeit schneller Sprachsynthese in Sprachdialogsystemen

Klaus-Peter Engelbrecht, Arne Denneler, Cliford Yangmia, Benjamin Weiss




Arabic text to speech synthesis system

Aymen El Kadhi, Guntram Strecha, Rüdiger Hoffmann, Hamid Amiri




Semantisches Taskmodell für Dialoge mit Taskwechsel

Sven Reichel, Philipp Pfarherr, Ute Ehrlich, André Berton, Michael Weber




Evaluation von Nutzersimulationen anhand eines Ähnlichkeitsmaßes für Dialogkorpora

Stefan Hillmann




Formale Subtextanalyse – Deduktion bedürfnisorientierter Propositionen aus narrativen Äußerungen

Peter Klimczak




Die kognitive Heizung

Peter Klimczak, Matthias Wolff, Jens Lindemann, C. Petersen, Ronald Romer, T. Zoglauer




Konstruktion einer mikrolokalen Grammatik mit OpenFST am Beispiel einer Home-Entertainment-Anwendung

Dennis Ritter , Günther Wirsching




Semantische Dekodierung von Sprachsignalen am Beispiel einer Mikrofonfeldsteuerung

Günther Wirsching, Matthias Wolff




Constructing Petri net transducers with PNTooL

Markus Huber, Robert Lorenz, Daniel Straßner




Semantische Verarbeitung von Gebärdensprache in intelligenten hierarchischen Sprachdialogsystemen

Jens Lindemann




Towards non-invasive velum state detection during speaking using high-frequency acoustic chirps

Peter Birkholz, Michael Schutte, Simon Preuß, Christiane Neuschaefer-Rube




Ein OPG-gesteuertes Serious Game zur Unterstützung mundmotorischer Übungen

Simon Preuß, Cornelia Eckers, Peter Birkholz, Christiane Neuschaefer-Rube




SOM’s and GSOM’s in biologically inspired models of speech processing

Bernd J. Kröger, Mengxue Cao




Modeling speech processing using NENGO: First steps

Bernd J. Kröger




Quality assessment in pronunciation trainer for speech disorder therapy

Ivan Kraljevski, R. Kompe, Rainer Jäckel, F. Kurnot, M. Rudolph, D. Hirschfeld, Rüdiger Hoffmann




Untersuchung segmentaler und suprasegmentaler Charakteristiken des Sprechsignals bei Morbus Parkinson

Rainer Jäckel, Guntram Strecha, Rüdiger Hoffmann, Bernd J. Kröger




Episodische Dysarthrie bei Hirnstammkompression - Akustisch-phonetische und auditiv-perzeptuelle Analyse eines Einzelfalls

Helena Kukla, Nina Kleiser, Bernd J. Kröger




Individuelle Ausprägung von Atmungspausen in der Mutterund in der Fremdsprache als Anzeichen kognitiver Belastung

Jürgen Trouvain, Bernd Möbius




HMM-based classification of glottalization phenomena in German-accented English

Maria Paola Bissiri, Ivan Kraljevski, Rüdiger Hoffmann




Zur Evaluierung von Intonationskonturen beim Fremdsprachenerwerb

Tristan Langenberg, Oliver Jokisch




Application of EmotionML

Felix Burkhardt, Christian Becker-Asano, Edmon Begoli, Roddy Cowie, Gerhard Fobe, Patrick Gebhard, Abe Kazemzadeh, Ingmar Steiner




The prosody of motivation: First results from an indoor cycling scenario

Lisa V. Skutella, Luise Süssenbach, Karola Pitsch, Petra Wagner




Significance of rhythmic duration patterns in German read corpus using cluster analysis

Zaheer Hussain




On the direct measurement and interactive 3D rendering of dummy-head directional characteristics using polar coordinates

György Wersényi, József Répás, Michael Graf




Sprecherlokalisierung mit einem 3D-Mikrofonfeld

Martin Birth




Anmerkungen zu den Begriffen „Verständlichkeit“ und „Verstehbarkeit“ bei der Sprachqualitätsmessung

Klaus Fellbaum, Dirk Höpfner




Eigenschaften von E-Gitarren - Mythen, Methoden, Merkmale

Gunter Ziegenhals




Transkription von Schlagzeugaufnahmen unter Verwendung des UASR-Systems

Stephan Hübler, Johannes Völkner, Rüdiger Hoffmann

2015




Phonetik und Sprachsignalverarbeitung

Hans G. Tillmann




Referenz im Diskurs. Theoretische und methodische Ansätze

Christian Lehmann




Awendungsorientierter Einsatz von Spracherkennung und Signalverarbeitung. Konkrete Projekte, Projektskizzen und Ideen

Franz Stieger




Sprachbedienung im Automobil

Gerd Gruchalski




A Phone-oriented Segment Model of the Human Cortex - a Hypothesis

Harald Höge




Eine webbasierte Experimentierumgebung mit Sprachdatenbank und Spracherkennung

Stephan Euler




Language Model Adaptation for Transcription of Banking Protocols

Ivan Kraljevski, Diane Hirschfeld




Textabhängige Sprechererkennung

Peter Geßler, Matthias Wolff




Wiedererkennbarkeit von Sprechern bei schmal- und breitbandiger Telefonübertragung

Sebastian Möller, Laura Fernández Gallardo, Michael Wagner




On the use of automatic speech recognizers for the quality and intelligibility prediction of synthetic speech

Florian Hinterleitner, Steffen Zander, Klaus-Peter Engelbrecht, Sebastian Möller




Experimente zur Wahrnehmung gezielt degradierter synthetischer Sprache

Eva Lasarcyk, Heiner Drenhaus, Bernd Möbius




Evaluating Commercial and Open Source Text-to-Speech Synthesis Considering Specifc Problem Classes

Felix Burkhardt




Modular Synthesis of Dis uencies for Conversational Speech Systems

Simon Betz, Petra Wagner, David Schlangen




Adaptive Speech Synthesis in a Cognitive Robotic Service Apartment

Angelika Hönemann, Petra Wagner




Pitch elbow detection

Uwe D. Reichel, Nele Salveste




Visual Feedback Tool for German Vowel Production

Patrick Carroll, Jürgen Trouvain, Frank Zimmerer




An Investigation of English Prosody Produced by Chinese Speakers

Hongwei Ding, Rüdiger Hoffmann, Daniel Hirst




Akustische Korrelate von Sympathieurteilen bei Hörern gleichen Geschlechts

Benjamin Weiss




Ein Datenset zur Untersuchung emotionaler Sprache in Kundenbindungsdialogen

Ingo Siegert, David Philippou-Hübner, Michael Tornow, Ralph Heinemann, Andreas Wendemuth, Kerstin Ohnemus, Sarah Fischer, Gerald Schreiber




Fusion von Klassifikationsmodellen zur automatischen Erkennung von Stimmeigenschaften in der Qualitätsbewertung von Callcenter-Gesprächen

Mathias Walther, Taieb Mellouli, Oliver Jokisch




Usability-Untersuchung der natürlichsprachlichen Bedienung eines Smart TV

Stefan Hillmann




Interpretation von Gebärdenspracheingaben am Beispiel einer Home-Entertainment-Steuerung

Jens Lindemann




Konzeption eines Kognitiven Systems für den experimentellen Einsatz in Forschung und Lehre

Ronald Römer, Matthias Wolff




Modellierung von Bewältigungsverhalten mit Merkmal-Werte-Relationen

Matthias Wolff, Werner Meyer, Ronald Römer




Das Labor für kognitive Systeme an der BTU Cottbus-Senftenberg

Christian Richter, Jens Lindemann, Ronald Römer, Matthias Wolff




Fortschritte in der elektro-optischen Stomatographie

Simon Preuß, Peter Birkholz




Smartphone-basierte Bewegungsanalyse im Fahrzeug

Tristan Langenberg, Oliver Jokisch




In uence of synthetically varied signal parameters of impulsive vehicle sounds on perceived quality

Marius Höchstetter, Philipp Seifert, Oliver Jokisch, Jesko L. Verhey, Ulrich Gabbert




Automatic differentiation of form-function-relations of the discourse particle "hm" in a naturalistic human-computer interaction

Alicia Flores Lotz, Ingo Siegert, Andreas Wendemuth




Modellierung des Semantik-Syntax Grenzübergangs kognitiver Systeme am Beispiel des "Mouse-Maze"-Problems

Markus Huber, Ronald Römer

2016




Motivation und Intelligenz

Dietrich Dörner




Informationsdarstellung nach den Gesetzen der Quantenmechanik und –logik

Ingo Schmitt




Ontologie und Semantik in der Auswertung von Texten im forensischen Umfeld

Dirk Labudde




Modeling Motor Planning in Speech Production Using the Neural Engineering Framework

Bernd J. Kröger, Trevor Bekolay, Peter Blouw




Towards a Mechanical Vocal Apparatus for Vowel Production

Ian S. Howard




GlottalImageExplorer – An Open Source Tool for Glottis Segmentation in Endoscopic High-Speed Videos of the Vocal Folds

Peter Birkholz




Untersuchung elastischer Materialien für künstliche Stimmlippen

Lin Wang, Simon Preuß, Peter Birkholz




The Statistics and Phone Error Rates of Bark-Features

Harald Höge




QUARK: Architecture for a Question Answering Machine

Felix Burkhardt




Spoken Language Understanding in Embedded Systems

Karl Weilhammer, Prince Kumar, Volker Springer, Dominique Massonie




Evaluierung von lexikalischer Adaption bei Sprachdialogen im Fahrzeug

Jakob Landesberger, Ute Ehrlich, André Berton




Erzeugung von Lautsequenzen für unbekannte Textsegmente mit Hilfe eines statistischen Ansatzes

Alexander Micheel, Hans-Günter Hirsch




Automatische Klassifikation des Ersteindrucks der Gesprächswahrnehmung bei ungeschulten Hörern

Mathias Walther, Frances Theres Beier, Taieb Mellouli, Baldur Neuber




Ein Beitrag zur Gedankengeometrie kognitiver Systeme

Ronald Römer, Markus Huber, Günther Wirsching




Multimodal Information Processing: The Ticket Purchase – a Demonstration Scenario of the SFB/TRR-62

Ingo Siegert, Stephan Reuter, Felix Schüssel, Georg Layher, Thilo Hörnle, Sascha Meudt, Andreas Wendemuth




Semantische Interpretation und Artikulation mit Äußerungs-Bedeutungs-Transduktoren

Jens Lindemann




WoOF: Ein Framework für Wizard of Oz Experimente

Markus Huber, Werner Meyer, Kati Nowack, Peter Geßler




Disfluent Lengthening in Spontaneous Speech

Simon Betz, Petra Wagner




F0 Declination and Speech Planning in Face to Face Dialogues

Susanne Fuchs, Uwe D. Reichel, Amélie Rochet-Capellan




How Prominence and Prosodic Phrasing Interact

Uwe D. Reichel, Katalin Mády, Felicitas Kleber




Characterization and Prediction of Dialogue Acts Using Prosodic Features

Katharina Mittelhammer, Uwe D. Reichel




Are we all Disfluent in our own Special Way and Should Dialogue Systems Also be?

Simon Betz, Soledad López Gambino




On the Assessment of Computer-Assisted Pronunciation Training Tools

Jürgen Trouvain, Jeanin Jügler, Yves Laprie




Speech Corpus Creation for Automatic Analysis of Phonetic Convergence

Grazyna Demenko, Jolanta Bachan, Agnieszka Wagner, Piotr Wyroslak




A Preliminary Study on the Inter-Lexical Pauses in L2 English Read by Chinese Students

Hongwei Ding, Rainer Jäckel, Rüdiger Hoffmann




Sprechtempo und Reduktion im Deutschen (SpuRD)

Matthias Hahn, Beat Siebenhaar




Zum Effekt von Tempo, Tonhöhe und Sprecherformant auf Sympathiebewertungen: Ein Resyntheseexperiment

Christoph Karnop, Benjamin Weiss




Evaluating Acoustic, Textual and Grammar Features for Alcohol Classification

Felix Neutatz, Dennis Schmidt, Moritz Teckenbrock, David Suendermann-Oeft




Measuring the Impact of Audio Compression on the Spectral Quality of Speech Data

Ingo Siegert, Alicia Flores Lotz, Linh Linda Duong, Andreas Wendemuth




Verhaltensanalyse von Einplatinencomputern beim Transcoding von Echtzeit-Audiodaten

Martin Meszaros, Michael Maruschke




Entwicklung einer universellen Audio- und Datenschnittstelle zur Sprachqualitätsmessung in digitalen Funknetzen

Enrico Lösch, Andreas Zimmermann, Alexander Schenk, Oliver Jokisch




Audio and Speech Quality Survey of the Opus Codec in Web Real-Time Communication

Oliver Jokisch, Michael Maruschke, Martin Meszaros, Viktor Iaroshenko




Extraktion und Vergleich musikalischer Rhythmen aus Aufnahmen von Klanghölzern

Günther Wirsching, Carolin Straub




Acoustic Event Classification for Ambient Assisted Living and Healthcare Environments

Hussein Hussein, Marc Ritter, Robert Manthey, Jan Schloßhauer, Etienne Fabian, Manuel Heinzig




Berührungslose Messung von Vitalparametern des Herzens

Kristian Kroschel, Martin Ruckhäberle




Sensorbasierte Bewegungsanalyse im Fahrzeug – Teil 2: Objektklassifikation mit maschinellem Lernen

Tristan Langenberg, Oliver Jokisch, Tilo Strutz

2017




Audio Compression and its Impact on Emotion Recognition in Affective Computing

Alicia Flores Lotz, Ingo Siegert, Michael Maruschke, Andreas Wendemuth




Manipulations of F0 contours in affective speech analysis

Magdalena Oleskowicz-Popiel, Jolanta Bachan




ikannotate2 – A Tool Supporting Annotation of Emotions in Audio- Visual Data

Ingo Siegert, Andreas Wendemuth




Robotic actuation of a 2D mechanical vocal tract

Ian S. Howard




Phonetische und korpus-linguistische Methoden bei der Analyse vokaler Kommunikation von freilebenden Schimpansen im Taï National Forest

Sven Grawunder, Natalie T. Uomini, Catherine Crockford




Vokaltraktmodelle im 18. Jahrhundert: Kempelen vs. Kratzenstein

Fabian Brackhane




An articulatory model of the complete vocal tract derived from medical images

Yves Laprie




An Improved Thresholding Function and Sparse Subspace decomposition for Speech Enhancement and its Application to Speech Recognition

Mohamed anouar Ben messaoud, Aïcha Bouzid




Herstellung und Charakterisierung künstlicher Stimmlippen aus Silikonkautschuk

Peter Birkholz, Lin Wang




Complex Emotions - The Simultaneous Simulation of Emotion- Related States In Synthesized Speech

Felix Burkhardt, Benjamin Weiss




Annotation specifications of a dialogue corpus for modelling phonetic convergence in technical systems

Grazyna Demenko, Jolanta Bachan




Prosodic Correlates of Voice Preference in Mandarin Chinese and German: A Cross-linguistic Comparison

Hongwei Ding, Rüdiger Hoffmann, Oliver Jokisch




Akustische Korrelate wahrgenommener Persönlichkeitsmerkmale und Stimmattraktivität

Daniel Duran, Natalie Lewandowski, Jagoda Bruni, Antje Schweitzer




Interacting with Robots - Tooling and Framework for Advanced Speech User Interfaces

Christian Hacker, Timo Sowa, Karl Weilhammer, Volker Springer, Dominique Massonie, Thomas Ranzenberger, Florian Gallwitz




Amplitude Envelope Kinematics of Speech Signal: Parameter Extraction and Applications

Lei He, Volker Dellwo




Quantifying the Benefits of Speech Recognition for an Air Traffic Management Application

Hartmut Helmke, Youssef Oualil, Marc Schulder




Little Drop of Mulligatawny Soup, Miss Sophie? Automatic Speech Understanding provided by Petri Nets

Markus Huber, Ronald Römer, Matthias Wolff




Enhancing the Objectivity of Interactive Formant Estimation: Introducing Euclidean Distance Measure and Numerical Conditions for Numbers and Frequency Ranges of Formants

Thayabaran Kathiresan, Dieter Maurer, Heidy Suter, Volker Dellwo:




Qualitative Evaluation and Error Analysis of Phonetic Segmentation

Arif Khan, Ingmar Steiner




A Head-Mounted Camera System for the Measurement of Lip Protrusion and Opening during Speech Production

Fabian Klause, Simon Stone, Peter Birkholz




Uprooting MaryTTS: Agile Processing and Voicebuilding

Sébastien Le Maguer, Ingmar Steiner




DevOps Manifesto for Speech Corpus Management

Ingmar Steiner




Speech Synthesis Evaluation: Realizing a Social Turn

Petra Wagner, Simon Betz




Perzeption von Sprechgeschwindigkeit und der (nicht nachgewiesene) Einfluss von Surprisal

Frank Zimmerer, Bistra Andreeva, Bernd Möbius, Zofia Malisz, Emmanuel Ferragne, François Pellegrino, Erika Brandt




Phone mapping and prosodic transfer in speech synthesis of similar dialect pairs

Michael Pucher, Carina Lozo, Sylvia Moosmüller




Developing new language tools for MaryTTS: the case of Luxembourgish

Ingmar Steiner, Sébastien Le Maguer, Judith Manzoni, Peter Gilles, Jürgen Trouvain




Regionale Variation in der deutschen Standardaussprache

Stefan Kleiner




First step Towards Enhancing Word Embeddings with Pitch Accent Features for DNN-based Slot Filling on Recognized Text

Sabrina Stehwien, Ngoc Thang Vu




Improving Phoneme Set Discovery for Documenting Unwritten Languages

Markus Müller, Jörg Franke, Sebastian Stüker, Alex Waibe




Long-range language modelling

Dietrich Klakow




Speaker-Group Specific Acoustic Differences in Consecutive Stages of Spoken Interaction

Ronald Böck, Olga Egorow, Andreas Wendemuth




Acoustic Source Localization in Home Environments - The Effect of Microphone Array Geometry (Work in Progress)

Timon Zietlow, Hussein Hussein, Danny Kowerko




Metalogue – Multiperspective Multimodal Dialogue

Jan Alexandersson




Ein Beitrag zur Formalisierung Finaler Systeme

Peter Klimczak, Ronald Römer, Matthias Wolff




Alex: An Artificial Conversational Agent for Students at the TU Berlin

Thilo Michael, Stefan Hillmann, Benjamin Weiss




Computation of L2 Speech Rhythm Based on Duration and Fundamental Frequency

Elisa Pellegrino, Lei He, Volker Dellwo




Investigating Phonetic Convergence in a Shadowing Experiment with Synthetic Stimuli

Eran Raveh, Iona Gessinger, Sébastien Le Maguer, Bernd Möbius, Ingmar Steiner




Unsupervised extraction of prosodic structure

Uwe D. Reichel




Semantische Repräsentation strukturierter Objekte im Hilbertraum und deren Verarbeitung nach quantenmechanischen Formalismen

Ingo Schmitt, Ronald Römer, Günther Wirsching, Matthias Wolff




Real-time manipulation of the F0-contour in synthetic speech using the Fujisaki model

Simon Stone, Konrad Schulze, Peter Steiner, Peter Birkholz




Towards the measurement of the Actor’s Formant in female voices

Sanya Tayal, Simon Stone, Peter Birkholz




Classification of Environmental Sounds for Future Hearing Aid Applications

Jürgen Tchorz, Simone Wollermann, Hendrik Husstedt




Surround Sound Processed by Opus Codec: A Perceptual Quality Assessment

Franziska Trojahn, Martin Meszaros, Michael Maruschke, Oliver Jokisch




Speaking rate variation and the interaction between hierarchical rhythmic levels

Agnieszka Wagner, Jolanta Bachan




Studying vocal social attractiveness by re-synthesis – results from two student projects applying acoustic morphing with Tandem- Straight

Benjamin Weiss, Anabell Hacker, Cleopatra Moshona, Frederic Rudawski, Matthias Ruhland




Gesture-based Articulatory Text to Speech Synthesis

Benjamin Weitz, Ingmar Steiner, Peter Birkholz




Nutzerzentrierter Entwurf von Multimodalen Bedienkonzepten

Ines Wendler, Andreas Jatho, Ivan Kraljevski, Martin Wenzel




A computer-assisted vowel trainer for the German language

Jeanin Jügler, Frank Zimmerer




Refinement Methods as Preprocessing or Postprocessing for Short- Term Spectra Analysis

Mohammed Krini




Formallogische Analysen des operanten Konditionierens

Peter Klimczak, Günther Wirsching




Human Feature Extraction – The Role of the Articulatory Rhythm

Harald Höge




Ein Drucksensor für (labiale) Plosive

Wolfgang Wokurek




Berührungslose Bestimmung der Herz- und Atmungsfrequenz

Kristian Kroschel, Jürgen Metzler




Biosignal-based spoken communication

Tanja Schultz

2018




The Mobile Cognitive Assistant: Bridging the Gap between In-Car and Outside-the-car Experiences

Dr. Stefan Ortmanns, Dr. Udo Haiber




Automatic Equalization for In-Car Communication Systems

Philipp Bulling, Klaus Linhard, Arthur Wolf, Gerhard Schmidt




Energy-Decay Based Postfilter for ICC Systems with Feedback Cancellation

Marco Gimm, Philipp Bulling, Gerhard Schmidt




On the relationship between instantaneous frequency and pitch in speech signals

Zied Mnasri, Hamid Amiri




Enhancing Multilingual Graphemic RNN based ASR Systems Using Phone Information

Markus Müller, Sebastian Stüker, Alex Waibel




Recent Improvements to Neural Network Based Acoustic Modeling in the EML Real-Time Transcription Platform

Volker Fischer, Omid Ghahabi, Siegfried Kunzmann




DNN Online Adaptation for Automatic Speech Recognition

Xinwei Li, Yue Pan, Matthew Gibson, Puming Zhan




Using Elementary Articulatory Gestures as Phonetic Units for Speech Recognition

Harald Höge




Evaluation of Different Excitation Generation Algorithms for Artificial Bandwidth Extension

Jonas Sautter, Friedrich Faubel, Markus Buck, Gerhard Schmidt




Unsupervised Neural-Network Based Vocal Tract Length Normalization

Philip Harding, Matthew Gibson




Multi-condition Deep Neural Network Training

Matthew Gibson, Christian Plahl, Puming Zhan, Gary Cook




A Robust Voice Activity Detection for Real-Time Automatic Speech Recognition

Omid Ghahabi, Wei Zhou, Volker Fischer




Ein Vorschlag für ein Webangebot zur Geschichte der Automatischen Spracherkennung

Stephan Euler




Zeichensatz-Erweiterung zur phonetischen Transkription pathologischer Sprache

Catharina Stille, Bernd J. Kröger




Voice Preference in German: A Cross-linguistic Comparison of Native and Chinese Listeners

Hongwei Ding, Rüdiger Hoffmann, Oliver Jokisch




Acoustic Addressee-Detection - Analysing the Impact of Age, Sex and Technical Knowledge

Ingo Siegert, Tang Shuran, Alicia Flores Lotz




Explorative Untersuchung von Multi-Intents in Sprachdialogsystemen

Jakob Landesberger, Daniel Kornmüller, Ute Ehrlich




Agenten in höheren Sphären - Quantenmechanische Situationsmodellierung kognitiver Systeme am Beispiel des Mouse-Maze-Problems

Markus Huber, Ronald Römer




Realisation of an Audio & Video Laboratory for Precise Object Localization and Tracking

Robert Manthey, Hussein Hussein, René Erler, Richard Siegel, Danny Kowerko




Towards a Speaking Style-Adaptive Assistant for Task-Oriented Applications

Maria Schmidt, Patricia Braunger




Simulation von Nutzerverhalten bei der Interaktion mit Sprachdialogsystemen mittels Künstlicher Neuronaler Netzwerke

Stefan Hillmann, Benjamin Weiss, Thilo Michael, Sebastian Möller




Untersuchung der kognitiven Beanspruchung durch Sprachassistenzsysteme

Daniel Duran, Natalie Lewandowski




Der Fockraum als Labyrinth: Wissensrepräsentation und Problemlösungen am Beispiel des Mouse-Maze-Problems

Peter beim Graben, Markus Huber, Ronald Römer, Ingo Schmitt, Matthias Wolff




Conversation modelling for chatbots: current approaches and future directions

Michael McTear




Kontinuierliche Schätzung von Sprechgeschwindigkeit mit einem Rekurrenten Neuronalen Netzwerk

Benjamin Weiss, Thilo Michael, Stefan Hillmann




Recognizing Modern Sound Poetry with LSTM Networks

Burkhard Meyer-Sickendiek, Hussein Hussein, Timo Baumann




Towards a speaker localization from spontaneous speech: north-south classification for speakers of contemporary German

Thomas Kisler, Florian Schiel




Emotion Recognition from Disturbed Speech - Towards Affective Computing in Real-World In-Car Environments

Alicia Flores Lotz, Fabian Faller, Ingo Siegert, Andreas Wendemuth




The Effect of Emotional Speech on Relative Speaker Discrimination

Juliane Höbel-Müller, Ronald Böck, Andreas Wendemuth




Influence of Age, Gender and Sample Duration on the Charisma Assessment of German Speakers

Oliver Jokisch, Viktor Iaroshenko, Michael Maruschke, Hongwei Ding




Testing speech perception today and tomorrow: serious computer games as perception tests

Natalie Lewandowski, Daniel Duran




Multimodal Affect Classification Using Deep Neural Networks

Friedhelm Schwenker




Acoustic Detection of Consecutive Stages of Spoken Interaction Based on Speaker-Group Specific Features

Ronald Böck, Olga Egorow, Andreas Wendemuth




Development of a Natural Language Speech Dialogue System for an AR-based, Adaptive Mobility Agent

Ivan Kraljevski, Marion Fischer, Aleksandar Gjoreski, Diane Hirschfeld




Dodging the Question in Competitive Spoken Dialogs: Semantic and Prosodic Characteristics

Uwe D. Reichel, Piroska Lendvai




Towards Natural Spoken Interaction with Artificial Intelligent Systems

Stefan Ultes




The Dragon Drive Innovation Showcase: Advancing the State-of-the-Art in Automotive Assistants

Julien Villemure, Peter Yeh, Robert Policano, Michael Kaisser, Rainer Gruhn




A Toolkit for 3D-Gesture and Speech Dialog in Automotive Environments

Timo Sowa, Alexander Richter, Dietmar Fey




Integration of a Kaldi Speech Recognizer into a Speech Dialog System for Automotive Infotainment Applications

Thomas Ranzenberger, Christian Hacker, Florian Gallwitz




Verhaltenssteuerung einer universellen kognitiven Benutzerschnittstelle anhand einer Heizungssteuerung

Werner Meyer, Markus Huber, Matthias Wolff




In-Car (Voice) Communication: Problems, Solutions, and Challenges

Gerhard Schmidt




Contactless Measurement of the Respiration Frequency by Vibrometry

Kristian Kroschel, Jürgen Metzler




Towards combined force and distance sensing using only optical sensors to aid in stroke rehabilitation

Christoph Wagner, Simon Stone, Peter Birkholz




Piano Transcriber - A Note-based Approach for Multipitch Tracking

Peter Steiner, Simon Stone, Peter Birkholz




Zu Mustern der Pausengestaltung in natürlicher und synthetischer Lesesprache

Jürgen Trouvain, Bernd Möbius




Ironic Speech - Evaluating Acoustic Correlates by Means of Speech Synthesis

Felix Burkhardt, Alexandra Steinhilber, Benjamin Weiss




Using state feedback to control an articulatory synthesizer

Ian S. Howard, Peter Birkholz




Optimierung der Numerik eines linearen Gleichungssystems für die Simulation des Schallfeldes im Vokaltrakt

Johann August Marwitz, Simon Stone, Peter Birkholz

2019




50 years Institute of Acoustics and Speech Communication – 30 years Conference Electronic Speech Signal Processing – 20 years Historic Acoustic-Phonetic Collection

Rüdiger Hoffmann




Investigation of densely connected convolutional networks with domain adversarial learning for noise robust speech recognition

Chia Yu Li, Ngoc Thang Vu




Convolutional neural networks can learn duration for detecting pitch accents and lexical stress

Sabrina Stehwien, Antje Schweitzer, Ngoc Thang Vu




Perception of German tense and lax vowel contrast by Chinese learners

Yingmin Gao, Hongwei Ding, Peter Birkholz, Rainer Jäckel, Yi Lin




Silent speech interfaces for speech restoration: current status and future challenges

José Andrés González López




Semi-automatische Generierung und Reinforcement Learning basiertes Training eines Dialogmanagers

Stefan Hillmann, Klaus-Peter Engelbrecht, Benjamin Weiss




Comparing phonetic changes in computer-directed and human-directed speech

Eran Raveh, Ingmar Steiner, Ingo Siegert, Iona Gessinger, Bernd Möbius




Analysis and categorization of corrections in multilingual spoken dialogue system

Ivan Kraljevski, Diane Hirschfeld




Speech and voice identity recognition in the human brain

Katharina von Kriegstein




Lernen durch Differenz. Zur logisch-mathematischen Struktur maschinellen Lernens

Peter Klimczak, Günther Wirsching, Matthias Wolff




Extraction of the Ɵ- and ɤ-cycles active in human speech processing from an articulatory speech database

Harald Höge




Bidirektionale Utterance-Meaning-Transducer für Zahlworte durch kompositionale minimalistische Grammatiken

Peter beim Graben, Werner Meyer, Ronald Römer, Matthias Wolff




In Articulation for Diversity

Korin Richmond




Comparison of different methods for the voiced excitation of physical vocal tract models

Peter Birkholz, Simon Stone, Steffen Kürbis




Resynthesizing the GECO speech corpus with VocalTractLab

Konstantin Sering, Niels Stehwien, Yingming Gao, Martin V. Butz, Harald Baayen




How should Pepper sound - Preliminary investigations on robot vocalizations

Felix Burkhardt, Milenko Saponja, Julian Sessner, Benjamin Weiss




Sprache von Produktgeräuschen – Mensch-Produkt Interaktion

Ercan Altinsoy




Influence of speech activity on vibrometer signals to extract vital parameters of humans

Kristian Kroschel, Jürgen Metzler




Schnelle Regelung eines monolithischen vollimplantierbaren Hörgeräts

Till Moritz Eßinger, Martin Koch, Matthias Bornitz, Hannes Seidler, Marcus Neudert, Thomas Zahnert




The restaurant booking corpus – content-identical comparative human-human and humancomputer simulated telephone conversations

Ingo Siegert, Jannik Nietzold, Ralph Heinemann, Andreas Wendemuth




ReTiCo: An open-source framework for modeling real-time conversations in spoken dialogue systems

Thilo Michael, Sebastian Möller




Segmenting multi-intent queries for spoken language understanding

Rohan Shet, Elena Davcheva, Christian Uhle




Exploration and assessment of proactive use cases for an in-car voice assistant

Maria Schmidt, Daniela Stier, Steffen Werner, Wolfgang Minker




Analysis of the influence of different room acoustics on acoustic emotion features

Juliane Höbel-Müller, Ingo Siegert, Ralph Heinemann, Alicia Flores Requardt, Michael Tornow, Andreas Wendemuth




Vergleich verschiedener Machine-Learning Ansätze zur kontinuierlichen Schätzung von perzeptivem Sprechtempo

Benjamin Weiss, Thilo Michael, Uwe Reichel, Oliver Pauly




IMS-speech: A speech to text tool

Pavel Denisov, Ngoc Thang Vu




Schätzung der spektralen Einhüllenden – Ein Vergleich von tiefen neuronalen Netzen und Codebüchern

Christopher Seitz, Mohammed Krini




Entscheidungstheoretische Modellierung der konsummatorischen Endhandlung – Vergleich von klassischen und quantenmechanischen Ansätzen

Ronald Römer, Peter beim Graben, Matthias Wolff




Multimodal speech segmentation using gaze data and spectrogram image features

Arif Khan, Ingmar Steiner




Design and deployment of multilingual industrial voice control applications

Ivan Kraljevski, M. Pohl, A. Gjoreski, U. Koloska, J. Wöhl, M. Wenzel, D. Hirschfeld




Drone sounds and environmental signals – a first review

Oliver Jokisch, Dominik Fischer




Surface stickiness and waviness of two-layer silicone structures for synthetic vocal folds

Falk Gabriel, Patrick Häsner, Eike Dohmen, Dmitry Borin, Peter Birkholz




A toolkit for nested multi-turn speech dialog in automotive environments

Timo Sowa, Soyuj Kumar Sahoo




Modell einer Frauenstimme für die artikulatorische Sprachsynthese mit VocalTractLab

Susanne Drechsel, Yingming Gao, Jens Frahm, Peter Birkholz




How to identify elliptical poems within a digital corpus of auditory poetry

Hussein Hussein, Burkhard Meyer-Sickendiek, Timo Baumann




Dynamic vocabulary with a Kaldi speech recognizer in a speech dialog system for automotive infotainment applications

Thomas Ranzenberger, Christian Hacker, Karl Weilhammer




Automatic vocal tract segmentation based on conditional generative adversarial neural network

Mohammad Eslami, Christiane Neuschaefer-Rube, Antoine Serrurier




The myoelastic-aerodynamic theory of sound production in humans, mammals, and birds

Christian Herbst




Filled pause detection by prosodic discontinuity features

Uwe D. Reichel, Benjamin Weiss, Thilo Michael




Zur Annotation nicht-verbaler Vokalisierungen in Korpora gesprochener Sprache

Jürgen Trouvain, Malte Belz




Towards ordinal classification of voice quality features with acoustic parameters

Felix Schaeffler, Matthias Eichner, Janet Beck




Analysis of coarticulation using EMA data with a statistical shape space model of the tongue

Alexander Hewer, Ingmar Steiner, Korin Richmond




Modelling vowel acquisition using the Birkholz synthesizer

Ian S. Howard, Peter Birkholz




Influence of the vocal tract morphology on the F1-F2 acoustic plane

Antoine Serrurier, Pierre Badin, Christiane Neuschaefer-Rube




Numerische Studie zum Einfluss laryngealer Areale auf individuelle und allgemeine akustische Eigenschaften des menschlichen Vokaltrakts bei gehaltenen Vokalen

Mario Fleischer, Alexander Mainka, Dirk Mürbe

2020




Sprachtechnologien für digitale Assistenten

Reinhold Häb-Umbach




Keyword Detection for the Activation of Speech Dialogue Systems

Hans-Günter Hirsch, Alexander Micheel, Michael Gref




Increasing Industrial Productivity by Employing a Smart Speech-Based Question Answering Assistant

Bojan Kovachki, Aleksandar Gjoreski, Robert Herms, Matthias Pohl, Martin Wenzel, Frank Seifert, Diane Hirschfeld




User Acceptance of Proactive Voice Assistant Behavior

Maria Schmidt, Wolfgang Minker, Steffen Werner




Überlegungen zu wahrnehmbaren Lächeln in synthetischen Stimmen

Jürgen Trouvain, Benjamin Weiss




Tongue Mouse - Comparison of Physical Measurement Principles

Kathleen Große, Peter Birkholz




Speech Fundamental Period Estimation using a Neural Network

Ian S. Howard




Articulatory Copy Synthesis using Long-Short Term Memory Networks

Yingming Gao, Peter Steiner, Peter Birkholz




Human-Computer Interaction closer to the Body

Michael Beigl




Contactless Measurement of Heart Sounds and Heart Rate with Laser Doppler Vibrometry

Kristian Kroschel, Armin Luik, Jürgen Metzler




A Hearing Aid to Visualize the Direction of Sound

Udo Gebelein, Stefan Rapp




Comparing KEC Recordings with Resynthesized EMA Data

Konstantin Sering, Fabian Tomaschek




Hesitation processing analysis using mouse-tracking and gamification

Simon Betz, Éva Székely, Sina Zarrieß, Marin Schröer, Leonie Schade, Petra Wagner




Simulating Turn-Taking in Conversations with Varying Interactivity

Thilo Michael, Sebastian Möller




Ein sprachübergreifender Vergleich des Pausenverhaltens natürlicher Sprecher in verschiedenen Sprechtempi mit TTS-Systemen

Raphael Werner, Jürgen Trouvain, Bernd Möbius




Low-Complexity Postfilter using MDCT-Domain for Speech and Audio Coding

Sneha Das, Tom Bäckström




Towards a Robust Analysis and Classification of Dog Barking

Maja Schneider, Oliver Jokisch




Spoken Language Identification by Means of Acosutic Mid-level Descriptors

Uwe D. Reichel, Andreas Triantafyllopoulos, Christopher Oates, Stephan Huber, Björn Schuller




The Nature of the Articulatory Code

Harald Höge




Comparison of the French and German articulatory spaces

Antoine Serrurier, Christiane Neuschaefer-Rube




Reduction of Aircraft Noise in UAV-Based Speech Signal Recordings by Quantile Based Noise Estimation

Enrico Lösch, Oliver Jokisch, Alexander Leipnitz, Ingo Siegert




Note Onset Detection using Echo State Networks

Peter Steiner, Simon Stone, Peter Birkholz




How to Identify Speech when Translating Unpunctuated Poetry

Timo Baumann, Burkhard Meyer-Sickendiek, Hussein Hussein




Die Welt ist nicht genug! Man muss auch über sie sprechen können

Ronald Römer, Peter beim Graben, Markus Huber, Peter Klimczak, Günther Wirsching, Matthias Wolff




Rule-Based Dialog Management for Voice Assistents in Automotive Environments

Soyuj Kumar Sahoo, Timo Sowa, Christian Hacker, Thomas Ranzenberger




Speaker Gender Classification based on an Improved Deep Learning Approach

Mohamed Anouar Ben messaoud, Aicha Bouzid




Machine Learning-Assisted Affect Labelling of Speech Data

Alicia F. Requardt, Olga Egorow, Andreas Wendemuth




Emergency Service – Sprachbasierte Klassifikation eingehender Anrufe in Ausnahmesituationen

Marcus Petersen, Karl-Heinz Niedrist, Matthias Busch, Florian Marquardt, Ingo Siegert




Uneindeutigkeiten in minimalistischen Grammatiken für Zahlworte – Probleme und Lösungsansätze

Mira Schielke, Henriette Heinrich




Filtering-Based Analysis of Spectral and Temporal Effects of Room Modes on Low-Level Descriptors of Emotionally Coloured Speech

Martin Gottschalk, Juliane Höbel-Müller, Ingo Siegert, Jesko L. Verhey, Andreas Wendemuth




Sprachtechnologien für Digitale Assistenten

Reinhold Häb-Umbach




Listening through a Cochlear Implant

Jesko L. Verhey




Zur Automatischen Schätzung von Kostenfunktionen aus Dialogen

Benjamin Weiss, Stefan Hillmann, Thilo Michael, Tilo Himmelsbach




Does Users’ System Evaluation Influence Speech Behavior in HCI? – First Insights from the Engineering and Psychological Perspective

Ingo Siegert, Matthias Busch, Julia Krüger




Vergleichende Untersuchung von Reinforcement Learning Verfahren beim Training eines Dialog Managers

Stefan Hillmann, Tilo Himmelsbach, Benjamin Weiss




Einflussfaktoren auf die Wahrnehmung von Prominenz im natürlichen Dialog

David Meier, Bistra Andreeva




Space fighters on stage - How the F1 and F2 vowel-space dimensions contribute to perceived speaker charisma

Oliver Niebuhr




Relationship Between Root Causes of Impairments and Perceptual Quality Dimensions of Super-wideband Transmitted Speech

Sebastian Möller, Tobias Hübschen, Gabriel Mittag, Gerhard Schmidt

2021




Speech Signal Compression Deteriorates Acoustic Cues to Perceived Speaker Charisma

Ingo Siegert, Oliver Niebuhr




`Alexa, who are you?´ – Analysing Alexa’s, Cortana’s and Siri’s Vocal Personality

Anabell Hacker




Pseudo-Labelling and Transfer Learning Based Speech Emotion Recognition

Siddarth Venkateswaran, Ronald Böck, Thomas Keßler, Ossmane Krini




Emotion Bias in Automatic Speech Recognition

Lara-Sophie Christmann




Age Classification: Comparison of Human vs Machine in Prompted and Spontaneous Speech

Felix Burkhardt, Markus Brückl, Björn W. Schuller




Cross-Lingual Acoustic Modeling in Upper Sorbian – Preliminary Study

Ivan Kraljevski, Marek Rjelka, Frank Duckhorn, Constanze Tschöpe, Matthias Wolff




Real-Time Implementation, Comparison, and Combination of Pitch Tracking Algorithms

Janina Reuter, Merikan Koyun, Christoph Daniel Schulze, Reinhard Von Hanxleden




Human pause detection in spontaneous speech in an online experiment

Jürgen Trouvain, Raphael Werner




Formalisierung und Implementierung einer adaptiven kognitiven Architektur unter Verwendung von Strukturdiagrammen

Werner Meyer, Borislav Borislavov, Friedrich Eckert, Christian Richter, Ronald Römer, Peter beim Graben, Markus Huber, Matthias Wolff




Audio and Video Processing of UAV-Based Signals in the Harmonic Project

Oliver Jokisch, Tilo Strutz, Alexander Leipnitz, Ingo Siegert,, Andrey Ronzhin




Automatic-Subtitling: Comparison on the Performance of Forced Alignment and Automatic Speech Recognition

Mino Lee Sasse, Stefan Schaffer, Aaron Ruß




Artificial Bandwidth Extension using a Glottal Excitation Model

Sebastian Barth, Simon Stone, Peter Birkholz




Towards reliability-guided information integration in audio-visual speech recognition

Wentao Yu, Steffen Zeiler, Dorothea Kolossa




On the Optimal Set of Features and the Robustness of Classifiers in Radar-based Silent Phoneme Recognition

Pouriya Amini Digehsara, Christoph Wagner, Petr Schaffer, Michael Bärhold, Simon Stone, Dirk Plettemeier, Peter Birkholz




Investigating the scarce data and resources problem for speech recognition using transfer learning and data augmentation

Fahrettin Gökgöz, Mahmoud Hashem




Open source automatic lecture subtitling

Benjamin Milde, Robert Geislinger, Irina Lindt, Timo Baumann




Towards Socially Interactive Agents with Explanatory Skill

Elisabeth André




Cortical Segmentation of Syllables

Harald Höge




TargetOptimizer 2.0: Enhanced Estimation of Articulatory Targets

Paul Konstantin Krug, Simon Stone, Alexander Wilbrandt, Peter Birkholz




Phonetic convergence evaluation based on fundamental frequency variability

Bistra Andreeva, Grazyna Demenko, Jolanta Bachan, Iona Gessinger, Karolina Jankowska, Bernd Möbius




Glottal Closure Instant Detection using Echo State Networks

Peter Steiner, Ian S. Howard, Peter Birkholz




Machine Learning analysis of speech and EGG for the diagnosis of voice pathology

Ian S. Howard, Julian Mcglashan, Adrian J. Fourcin




Predictive articulatory speech synthesis with semantic discrimination

Paul Schmidt-Barbo, Elnaz Shafaei-Bajestan, Konstantin Sering




The effect of Lombard speech modifications in different information density contexts

Omnia Ibrahim, Ivan Yuen, Marjolein Van Os, Bistra Andreeva, Bernd Möbius




Intents in Sprachdialogen: Eine Praxisperspektive

Benjamin Weiss, Stefan Hillmann, Sebastian Möller




VADiMoS: A Web Tool for Designing Voice Assistant Independent and Ontology Based Dialogs

Thomas Ranzenberger, Christian Hacker




Anticipatory coarticulation in predictive articulatory speech modeling

Konstantin Sering, Fabian Tomaschek, Motoki Saito




Developing the German Pronunciation Database (DAD) - an online dictionary for spoken German

Alexandra Ebel, Johannes Förster, Mathias Walther




Untersuchung von Qualitätsunterschieden zwischen gesprochener und geschriebener Sprache bei Interaktion mit einem Chatbot

Marco Braune




Der Faktor Mensch in der Mensch-Maschine-Interaktion

Daniel Duran, Sarah Warchhold




Comparison of Training Behaviour and Performance of Reinforcement Learning based Policies for Dialogue Management

Stefan Hillmann, Tilo Himmelsbach, Benjamin Weiss




Comparing BERT with an intent based question answering setup for open-ended questions in the museum domain

Md. Mahmud-Uz-Zaman, Stefan Schaffer, Tatjana Scheffler




Eine Maschinensemiotische Pertinetz-Architektur für ein menschenzentriertes User-Interface

Peter Klimczak, Markus Huber, Peter beim Graben, Günther Wirsching




Normalisierungsmethoden für Intent Erkennung Modularer Dialogsysteme

Jan Nehring, Akhyar Ahmed




All Interaction is Situated, All Language is Grounded: Implications for the Design of Spoken Dialogue Systems

David Schlangen




Natural and synthetic speech comprehension in simulated tonal and pulsatile tinnitus: A pilot study

Jacek Kudera, Marjolein Van Os, Bernd Möbius




Knock-Knock! Who’s There? The Laughter-Enhanced Virtual Real-Estate Agent

Bogdan Ludusan, Petra Wagner




Evaluating the effect of pauses on number recollection in synthesized speech

Mikey Elmers, Raphael Werner, Beeke Muhlack, Bernd Möbius, Jürgen Trouvain




Prediction of Background Noise Degradations in Fullband Speech Communication Scenarios

Sebastian Möller, Andreas Bütow




Studie zur Lösbarkeit des Problems starker Pegelschwankungen im Home-Entertainment

Georg Schmidt, Ingo Siegert




Intelligibility in Telephone Conversations with Packet Loss

Thilo Michael

2022




Producing syllables: motor planning, motor programming and execution

Bernd J. Kröger, Trevor Bekolay




Improved features driving an T-oscillator for cortical segmentation of speech into syllables

Harald Höge




Speech intelligibility prediction with hybrid auditory model- and ML-based methods: The best of two worlds?

Birger Kollmeier, David Hülsmeier, Anna Warzybok




Towards a soft fluidic elastomer tongue for a mechanical vocal tract

Peter Birkholz, Christian Kosmas Mayer, Patrick Häsner




Using semantic embeddings for initiating and planning articulatory speech synthesis

Paul Schmidt-Barbo, Sebastian Otte, Martin V. Butz, R. Harald Baayen, Konstantin Sering




Articubench - An articulatory speech synthesis benchmark

Konstantin Sering, Paul Schmidt-Barbo




Efficient exploration of articulatory dimensions

Paul Konstantin Krug, Peter Birkholz, Branislav Gerazov, Daniel Rudolph Van Niekerk, Anqi Xu, Yi Xu




Is there a hesitation bias for ambiguous color terms?

Simon Betz, Ricardo Davids, Caroline Müller, Éva Székely, Petra Wagner, Maischa Amelie Weber, Cassandra Youssef-Baronfeind, Sina Zarrieß




Analysis of phonetic/prosodic features in interaction stages

Daniel Duran, Ronald Böck




Lexical frequency and listener's response to packet loss in telephone conversations

Thilo Michael, Omnia Ibrahim




The power of conversation flow in video conference tools: evaluation of speaker change cues

Mincheng Chang, Thilo Michael, Sebastian Möller, David Schlangen




Times and turns in stimulating meetings

Ronald Böck




Upcoming new ITU-T recommendation on the evaluation of text-based chatbots

Sebastian Möller, Stefan Hillmann, Thilo Michael, Jan Nehring, Tim Polzehl




Kommunikative Komponenten sozialer Intelligenz von künstlichen kooperativen Spielenden

Casey C. Bennett, Benjamin Weiss, Jaeyoung Suh, Eunseo Yoon, Jihong Jeong, Sungmin Yang, Yejin Chae




The voice of creativity: Effects of pitch range in the voice of a robot facilitator

Kerstin Fischer, Oliver Niebuhr, Ali Asadi




Erroneous reactions of voice assistants

Lea Kisser, Ingo Siegert




Perceptual cues for smiled voice - An articulatory synthesis study

Simon Stone, Pia Abdul-Hak, Peter Birkholz




Perceptual categorization of breath noises in speech pauses

Raphael Werner, Jürgen Trouvain, Beeke Muhlack, Bernd Möbius




Einfluss von Entrauschungsverfahren auf die automatische Segmentierung mit WebMAUS

Lorenz Gutscher, Nicola Klingler, Michael Pucher




Vergleichende Evaluation von zwei Ansätzen für ein Question-Answering System

Katja Schreiber, Stefan Hillman




The Charles - A new sensor device for measuring body language and stress in speech communication

Vidar Freyr Gudmundsson, ïo Valls-Ratés, Oliver Niebuhr




F1 and F2 formant variations and inter-speaker articulatory variability: A preliminary analysis

Antoine Serrurier, Christiane Neuschaefer-Rube




The effects of the online visualization of acoustic-prosodic features of speech on speakers' productions

Kerstin Fischer, Oliver Niebuhr




Detection of salient events in an acoustical scene

Kristian Kroschel




A Window-based method for target estimation

Paul Konstantin Krug




Comparing detection methods for pause-internal particles

Mikey Elmers




Comprehension of closely related languages: A visual world eye tracking study

Jacek Kudera, Philip Georgis, Hasan Md Tusfiqur Alam, Bernd Möbius, Tania Avgustinova, Dietrich Klakow




Prosodic characteristics of Bulgarian-Accented German

Bistra Andreeva, Snezhina Dimitrova




Improving the quality of synthesized speech of a Viennese dialect speaker through speaker adaptation

Lorenz Gutscher, Michael Pucher




Emotion preservation for one-shot speaker anonymization using McAdams

Yamini Sinha, Andreas Wendemuth, Ingo Siegert




"High on emotion?" How audio codecs interfere with the perceived charisma and emotional states of men and women

Oliver Niebuhr, Ingo Siegert

2023




Comparison of Object Tracking Algorithms for Larynx Phantom Movements in Ultrasound Videos

Christian Kleiner, Peter Birkholz




Anwendung des MFCC-Plotters zur Erfassung cepstraler Unterschiede in emotionaler Sprache

Frederick Kukla, Vanessa Reichel




Analysis of Transcriptions Using Octra – A Pilot Study

Christoph Draxler




How May I Interrupt? Linguistic Design Guidelines for Proactive In-Car Voice Assistants

Anna-Maria Meck




Automatic User Experience Evaluation of Goal-Oriented Dialogs Using Pre- Trained Language Models

Mika Rebensburg, Stefan Hillmann, Nils Feldhus




A Comparison of Module Selection Strategies for Modular Dialog Systems

Philine Görzig, Jan Nehring, Stefan Hillmann, Sebastian Möller




Automatic Generation of Website-Based Multi-Turn Question-Answering Dialog Systems

Stefan Hillmann, Philine Görzig, Sebastian Möller




Going Retro: Astonishingly Simple Yet Effective Rule-Based Prosody Modelling for Speech Synthesis Simulating Emotion Dimensions

Felix Burkhardt, Uwe Reichel, Florian Eyben, Björn Schuller




Cross-Reliability Benchmark Test for Preserving Emotional Content in Speech–Synthesis Related Datasets

Jan Hintz, Andreas Wendemuth, Ingo Siegert




Collecting and Annotating Natural Child Speech Data – Challenges and Interdisciplinary Perspectives

Hanna Ehlert, Edith Beaulac, Maren Wallbaum, Christopher Gebauer, Lars Rumberg, Jörn Ostermann, Ulrike Lüdtke




Pronunciation Modelling for Children’s Speech

Christopher Gebauer, Lars Rumberg, Jörn Ostermann




A First Report on a Perceptual Trainig Study Using Percy

Birgitte Poulsen, Ocke-Schwen Bohn, Christoph Draxler




Muster der Sprechatmung in verschiedenen Sprechstilen – Eine Pilotstudie

Jürgen Trouvain, Raphael Werner




An Automatic Method for Speech Breathing Annotation

Alexis Deighton Macintyre, Raphael Werner




Hesitation Lengthening Elicitation and Detection via Target Words in a Card Game Study

Simon Betz




Somatosensory Feedback in PAULE

Konstantin Sering, Paul Schmidt-Barbo




Concept for Semantic Error Analysis in a Mobile Application for Speech and Language Therapy Support

Eugenia Rykova, Mathias Walther




RehaLingo – Towards a Speech Training System for Aphasia

Hans-Günter Hirsch, Christian Neumann, Yannic Tiggelkamp, Riccardo Fiorista, Stefan Knecht, Alfons Schnitzler, Katja Biermann-Ruben, Dietmar Bothe, Günter Bleimann, Hendrike Frieg




Training a CNN to Estimate Voice Pathology from Connected Speech Using EGG to Automatically Label the Dataset for Voicing

Ian S. Howard, Julian Mcglashan, Adrian J. Fourcin




Implementing Easy-to-Use Recipes for the Switchboard Benchmark

Dominik Wagner, Sebastian P. Bayerl, Tobias Bocklet




Bias in Flemish Automatic Speech Recognition

Aaricia Herygers, Vass Verkhodanova, Matt Coler, Odette Scharenborg, Munir Georges




Nkululeko: A Template Based System for Fast Machine Learning Experiments on Speaker Characteristics

Felix Burkhardt




The Hochschul-Assistenz-System HanS: an ML-Based Learning Experience Platform

Thomas Ranzenberger, Tobias Bocklet, Steffen Freisinger, Lia Frischholz, Munir Georges, Kevin Glocker, Aaricia Herygers, René Peinl, Korbinian Riedhammer, Fabian Schneider, Christopher Simic, Khabbab Zakaria




Transcription Portal – A Zero-configuration Workbench for Transcribing Spoken Language Recordings

Christoph Draxler, Julian Pömp




Articulatory Speech Synthesis in the Context of Speech Research and Speech Technology: Review and Prospect

Bernd J. Kröger




Can Deep Learning Help to Understand Speech Production Mechanisms?

Antoine Serrurier




Synchrony of Θ - Oscillations in Speech Perception and Speech Production

Harald Höge




Persian Speaker Classification Using Rhythmic Features

Neda Mousavi, Sven Grawunder




Approach to Speaker-Generalized Spectral Envelope Estimation by Deep Recurrent Neural Network for Speech Reconstruction in a Speech Enhancement System

Stefan Ciba, Mohammed Krini, Amir Rajabi




iDOKS: Ein integriertes Dokumentationssystem zur Zusammenfassung von Gesprächen und Meetings

Robert Wardenga, Daniel Vogel, Felix Gräßer, Mira Schielke, Leonard Starke, Rico Petrick, Torsten Rex, Jens Lehmann




Adapters for Resource-Efficient Deployment of NLU Models

Jan Nehring, Nils Feldhus, Akhyar Ahmed




Radlogistik als Anwendungsgebiet für Digitale Sprachassistenten – Ein Diskussionsbeitrag

Matthias Busch, Malte Kania, Tom Assmann, Ingo Siegert

2024




More Than Words: Advancements and Challenges in Speech Recognition for Singing

Anna Kruspe




Linguistic Politeness in Artificial Conversational Agents

Hendrik Buschmeier




Chatbot in the Museum - A Field Study of User Experience and Modality Usage

Stefan Schaffer, Eva Schwaetzer, Aaron Ruß, Oliver Gustke




Usability and User Experience of a Chatbot for Student Support

Stefan Hillmann, Philine Kowol, Adnan Ahmad, Ruochen Tang, Sebastian Möller




Interaktionsverhalten eines Avatars im digitalen sprachtherapeutischen Setting

Mathias Walther, Elisabeth Zeuner, Eugenia Rykova




Review of Usage and Potentials of Conversational Interfaces at Universities and in Students Daily Lifes

Lea Kisser, Matthias Busch, Ingo Siegert




Perception of Formant Distortion in German Words and Non-words

Uliana Eliseeva, Ivan Yuen, Bernd Möbius




Synchrony of Glottal Area Waveform Parameters During the Production of Obstruents in Vowel Context

Joao Vitor Possamai De Menezes, Christian Kleiner, Marie-Anne Kainz, Matthias Echternach, Peter Birkholz




Computergestützte Bestimmung des Sprechflusses bei Vorschulkindern

Valentin Kany, Jürgen Trouvain




The Use of Temporal Features in Cortical Segmentation of Syllables

Harald Höge




Epsilon-Verarbeitung bei Minimalistischen Grammatiken für Zahlen .

Johannes Kuhn, Matthias Wolff, Borislav Borislavov




NoiSLU: A Noisy Speech Corpus for Spoken Language Understanding in the Public Transport Domain

Mariano Frohnmaier, Steffen Freisinger, Madeline Faye Holt, Munir Georges




Ein quantenlogisch motivierter Ansatz zur Verarbeitung von Äußerungs- Bedeutungspaaren

Markus Huber-Liebl, Günther Wirsching




Octra Backend - Eine skalierbare Infrastruktur für Transkriptionsprojekte

Christoph Draxler, Julian Pömp




An Investigation of Acoustic Features of the Lower Vocal Tract for Speaker Recognition .

Peter Birkholz, Xinyu Zhang




Towards Speech Privacy Assessment for Voice Assistants: Exploring Subjective and Objective Measures for Babble Noise

Anjana Rajasekhar, Anna Leschanowsky, Nils Peters




Konzept und Evaluation eines Softwaresystems zur Unterstützung der CRM-basierten Sprechwirkungsuntersuchung

Thorben Frank Jahnke, Corinna Sonnen, Mathias Walther




In Tune With In-Poco? A New Device for Analyzing and Training the Interplay of Body Posture and Charismatic Speech Prosody

Tobias Blaabjerg Karlsen, Karl Jhon Decuzar De Castro, Emils Pipars, Iyad Ahed Abdelrahman Abdel Qader, Jose Dumitru Ilinca Sainz, Simas Srugys, Oliver Niebuhr




Can Language Models Behave Like Wine Sommeliers? Using Multiple Agents To Evaluate The Quality of Wine Descriptors Generated By Llama 2

Siddarth Venkateswaran, Ronald Böck




Supervised vs. Zero-Shot Learning Automatic Classification of Comments on Educational Videos Using Pre-Trained Language Models

Benedict Kettler, Stefan Hillmann




Is there Text in Wine? - S+U Learning-Based Named Entity Recognition and Triplet Extraction from Wine Aroma Descriptors

Siddarth Venkateswaran, Abdullah Al Foysal, Nazeer Basha Shaik, Ronald Böck




Can We See Your Response Before You Speak? Exploring Linguistic Information Found in Inter-Turn Pauses

Christian Schuler, Shravan Nayak, Debjoy Saha, Timo Baumann




Speech/Non-Speech Classification Slightly Improves Synthesis Quality in PAULE

Konstantin Sering




Evaluation of Audio Deepfakes - Systematic Review

Yamini Sinha, Jan Hintz, Ingo Siegert




Evaluating the Impact of Prosody Feature Normalization on the Controllability of Pitch in Speech Synthesis

Judith Bauer, Frank Zalkow, Meinard Müller, Christian Dittmar




Listener-Oriented Consequences of Predictability-Based Acoustic Adjustment

Omnia Ibrahim, Ivan Yuen, Wei Xue, Bistra Andreeva, Bernd Möbius




Speech Recognition Errors in ASR Engines and Their Impact on Linguistic Analysis in Psychotherapies

Martha Schubert, Yamini Sinha, Julia Krüger, Ingo Siegert




Empirical Evaluation of ASR and NLU in a Multimodal Dialogue System for Survey Answering

Philipp L. Harnisch, Stefan Hillmann




Extending HAnS: Large Language Models for Question Answering, Summarization, and Topic Segmentation in an ML-based Learning Experience Platform

Thomas Ranzenberger, Tobias Bocklet, Steffen Freisinger, Munir Georges, Kevin Glocker, Aaricia Herygers, Korbinian Riedhammer, Fabian Schneider, Christopher Simic, Khabbab Zakaria




The Influence of Signal Segmentation Methods on Rhythm-Based Speaker Recognition

Neda Mousavi, Sven Grawunder




Unsupervised Emotional Pattern Recognition Using Rhythmic and Vocal Features

Neda Mousavi, Seyyed Saeed Sarfjoo, Sven Grawunder