,

An Emphatic Approach to the Problem of Off-policy Temporal-Difference Learning.

, , и .
J. Mach. Learn. Res., (2016)

Метаданные

тэги

Пользователи данного ресурса

  • @dblp

Комментарии и рецензии