Semi-automatische Generierung und Reinforcement Learning basiertes Training eines Dialogmanagers
Authors: Stefan Hillmann, Klaus-Peter Engelbrecht, Benjamin Weiss
Abstract:
In diesem Beitrag beschreiben wir unseren Ansatz, einen Dialogma-nager aus einer Ontologie heraus zu generieren und diesen dann mittels Q-Learningund einer Nutzersimulation zu trainieren. Dieser Ansatz wird auf die Domäne einesTroubleshooter angewendet, für den aktuell eine händisch definierte und gewarteteImplementierung existiert. Die gelernte Dialog Policy senkt signifikant die Längeder Dialoge und Höhe der Nutzeraufwände.