,

Dueling RL: Reinforcement Learning with Trajectory Preferences.

, , и .
AISTATS, том 206 из Proceedings of Machine Learning Research, стр. 6263-6289. PMLR, (2023)

Метаданные

тэги

Пользователи данного ресурса

  • @dblp

Комментарии и рецензии