@InProceedings{Weiss2020_462,
author = {Benjamin Weiss and Stefan Hillmann and Thilo Michael and Tilo Himmelsbach},
booktitle = {Studientexte zur Sprachkommunikation: Elektronische Sprachsignalverarbeitung 2020},
title = {Zur Automatischen Schätzung von Kostenfunktionen aus Dialogen},
year = {2020},
editor = {Andreas Wendemuth and Ronald Böck and Ingo Siegert},
month = mar,
pages = {236--240},
publisher = {TUDpress, Dresden},
abstract = {In diesem Kurzbeitrag wird der Ansatz von Reinforcement Learning für die Lernen von Systemverhalten von Sprachdialogsystemen kurz vorgestellt. Dabei wird insbesondere auf das Potential der automatische Rekonstruktion von Kostenfunktionen aus Dialogdaten, dem Inversen Reinforcement Learning (IRL) eingegangen, und eine Forschungsaufgabe postuliert, um IRL auf seinen Nutzen für die Untersuchung und Anwendung von Meta-Kommunikation in Sprachdialogsystemen hin zu überprüfen.},
isbn = {978-3-959081-93-1},
issn = {0940-6832},
keywords = {Dialogue},
url = {https://www.essv.de/pdf/2020_236_240.pdf},
}