@InProceedings{Weiss2020_462,
author = {Benjamin Weiss and Stefan Hillmann and Thilo Michael and Tilo Himmelsbach},
booktitle = {Studientexte zur Sprachkommunikation: Elektronische Sprachsignalverarbeitung 2020},
title = {Zur Automatischen Schätzung von Kostenfunktionen aus Dialogen},
year = {2020},
editor = {Andreas Wendemuth and Ronald Böck and Ingo Siegert},
month = mar,
pages = {236--240},
publisher = {TUDpress, Dresden},
abstract = {In diesem Kurzbeitrag wird der Ansatz von Reinforcement Learning
für die Lernen von Systemverhalten von Sprachdialogsystemen kurz vorgestellt.
Dabei wird insbesondere auf das Potential der automatische Rekonstruktion von
Kostenfunktionen aus Dialogdaten, dem Inversen Reinforcement Learning (IRL)
eingegangen, und eine Forschungsaufgabe postuliert, um IRL auf seinen Nutzen
für die Untersuchung und Anwendung von Meta-Kommunikation in Sprachdialogsystemen
hin zu überprüfen.},
isbn = {978-3-959081-93-1},
issn = {0940-6832},
keywords = {Dialogue},
url = {https://www.essv.de/pdf/2020_236_240.pdf},
}