@InProceedings{Hillmann2020_464,
<br/>   author = {Stefan Hillmann and Tilo Himmelsbach and Benjamin Weiss},
<br/>   booktitle = {Studientexte zur Sprachkommunikation: Elektronische Sprachsignalverarbeitung 2020},
<br/>   title = {Vergleichende Untersuchung von Reinforcement Learning Verfahren beim Training eines Dialog Managers},
<br/>   year = {2020},
<br/>   editor = {Andreas Wendemuth and Ronald Böck and Ingo Siegert},
<br/>   month = mar,
<br/>   pages = {249--256},
<br/>   publisher = {TUDpress, Dresden},
<br/>   abstract  = {Unter Verwendung des Frameworks PLATO wurde die Policy eines
Dialogmanagers mit drei verschiedenen Reinforcement Learning Algorithmen
trainiert. Es zeigt sich, dass REINFORCE etwas schneller lernt als WoLF-PHC
und deutlich schneller als Q-Learning. Auch hinsichtlich des erreichten Aufgabenerfolgs
liegen REINFORCE und WoLF-PHC in etwa gleich auf und beide deutlich
vor Q-Learning.},
<br/>   isbn = {978-3-959081-93-1},
<br/>   issn = {0940-6832},
<br/>   keywords = {Dialogue},
<br/>   url = {https://www.essv.de/pdf/2020_249_256.pdf},
<br/>}