Q-learning

Аннотация

Q-learning (Watkins, 1989) is a simple way for agents to learn how to act optimally in controlled Markovian domains. It amounts to an incremental method for dynamic programming which imposes limited computational demands. It works by successively improving its evaluations of the quality of particular actions at particular states.

ключ BibTeX: Watkins1992
тип записи: article
год: 1992
месяц: may
день: 01
журнал: Machine Learning
номер: 3
страницы: 279--292
том: 8
issn: 1573-0565
DOI: 10.1007/BF00992698
url: https://doi.org/10.1007/BF00992698

тэги

Пользователи данного ресурса

Комментарии и рецензиипоказать / перейти в невидимый режим

Пожалуйста, войдите в систему, чтобы принять участие в дискуссии (добавить собственные рецензию, или комментарий)

BibSonomy

Аннотация

тэги

Пользователи данного ресурса

Комментарии и рецензиипоказать / перейти в невидимый режим

Цитировать эту публикацию

искать в