Zur Automatischen Schätzung von Kostenfunktionen aus Dialogen

Benjamin Weiss; Stefan Hillmann; Thilo Michael; Tilo Himmelsbach

Zur Automatischen Schätzung von Kostenfunktionen aus Dialogen

Authors: Benjamin Weiss, Stefan Hillmann, Thilo Michael, Tilo Himmelsbach

Abstract:

In diesem Kurzbeitrag wird der Ansatz von Reinforcement Learning für die Lernen von Systemverhalten von Sprachdialogsystemen kurz vorgestellt. Dabei wird insbesondere auf das Potential der automatische Rekonstruktion von Kostenfunktionen aus Dialogdaten, dem Inversen Reinforcement Learning (IRL) eingegangen, und eine Forschungsaufgabe postuliert, um IRL auf seinen Nutzen für die Untersuchung und Anwendung von Meta-Kommunikation in Sprachdialogsystemen hin zu überprüfen.

Year: 2020
In session: Dialogue
Pages: 236 to 240