ESSV Konferenz Elektronische Sprachsignalverarbeitung

Title: Hierarchische kognitive dynamische Systeme zur Sprach- und Signalverarbeitung

Authors: Matthias Wolff, Ronald Römer, Rüdiger Hoffmann

Abstract:

In diesem Positionspapier stellen wir ausgehend von klassischen Erkenntnissen der Sprach– und Signalverarbeitung das im letzten Jahrzehnt von uns entwickelte ”Einheitliche System zur Sprachsynthese und –erkennung“ (UASR) vor. Dieses steht in enger Beziehung zu neueren Ansätzen in der Systemtheorie, namentlich den kognitiven dynamischen Systemen. Diese lassen bislang jedoch weitestgehend die für eine ”Erkenntnisfähigkeit“ unerlässliche hierarchische Modellierung und Systemstruktur außer acht (obwohl deren Notwendigkeit als unumstritten gelten kann). Die Konstruktionsprinzipien unseres Systems sind: hierarchische Struktur, gemeinsame Daten für Analyse und Synthese sowie einheitliche Algorithmen auf allen Ebenen. Wir argumentieren weiterhin, dass kognitive (Sprach–) Kommunikationsysteme ein inneres Modell ihres Kommunikationspartners haben müssen und zeigen, wie dieses auf naheliegende Weise technisch realisiert werden kann. Sowohl die hierarchische Struktur als auch die ”Spiegelung“ des Kommunikationspartners sind durch die Neurobiologie beim natürlichen Vorbild belegt. Als technologische Basis schlagen wir endliche Transduktoren (finite state transducers) vor. Wir haben gezeigt, dass diese für unsere Aufgabe universell sind und prinzipiell auf allen Verarbeitungsebenen von der akustischen bis hin zur pragmatischen für Analyse und Synthese eingesetzt werden können. Abschließend geben wir ein Konzept für hierarchische kognitive dynamische Sprach- und Signalverarbeitungssysteme an und benennen die aus unserer Sicht künftig interessanten Forschungsthemen.


Year: 2012
In session: Hauptvortrag
Pages: 159 to 178