Zur Automatischen Schätzung von Kostenfunktionen aus Dialogen
Authors: Benjamin Weiss, Stefan Hillmann, Thilo Michael, Tilo Himmelsbach
Abstract:
In diesem Kurzbeitrag wird der Ansatz von Reinforcement Learning für die Lernen von Systemverhalten von Sprachdialogsystemen kurz vorgestellt. Dabei wird insbesondere auf das Potential der automatische Rekonstruktion von Kostenfunktionen aus Dialogdaten, dem Inversen Reinforcement Learning (IRL) eingegangen, und eine Forschungsaufgabe postuliert, um IRL auf seinen Nutzen für die Untersuchung und Anwendung von Meta-Kommunikation in Sprachdialogsystemen hin zu überprüfen.