From post

копировать удалить добавить публикацию в буфер
Запись сообщества
посмотреть историю данной записи
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

A Kernel Perspective on Behavioural Metrics for Markov Decision Processes.

P. Castro, T. Kastner, P. Panangaden, и M. Rowland. CoRR, (2023)

Please choose a person to relate this publication to

To differ between persons with the same name, the academic degree and the title of an important publication will be displayed.

Herbert Rowland

Rowland Onyenali

Rowland Lassen

Rowland Enyinnaya Eruba

Rowland Nii-Adjei Otchwemah

Другие публикации лиц с тем же именем

Distributional Reinforcement Learning with Quantile Regression.W. Dabney, M. Rowland, M. Bellemare, и R. Munos. CoRR, (2017)Adaptive Trade-Offs in Off-Policy Learning.M. Rowland, W. Dabney, и R. Munos. AISTATS, том 108 из Proceedings of Machine Learning Research, стр. 34-44. PMLR, (2020)Conditional Importance Sampling for Off-Policy Learning.M. Rowland, A. Harutyunyan, H. van Hasselt, D. Borsa, T. Schaul, R. Munos, и W. Dabney. AISTATS, том 108 из Proceedings of Machine Learning Research, стр. 45-55. PMLR, (2020)Meta-learning of Sequential Strategies.P. Ortega, J. Wang, M. Rowland, T. Genewein, Z. Kurth-Nelson, R. Pascanu, N. Heess, J. Veness, A. Pritzel, P. Sprechmann и 14 other автор(ы). CoRR, (2019)Human Alignment of Large Language Models through Online Preference Optimisation.D. Calandriello, D. Guo, R. Munos, M. Rowland, Y. Tang, B. Pires, P. Richemond, C. Lan, M. Valko, T. Liu и 3 other автор(ы). CoRR, (2024)Nash Learning from Human Feedback.R. Munos, M. Valko, D. Calandriello, M. Azar, M. Rowland, Z. Guo, Y. Tang, M. Geist, T. Mesnard, A. Michi и 7 other автор(ы). CoRR, (2023)MICo: Learning improved representations via sampling-based state similarity for Markov decision processes.P. Castro, T. Kastner, P. Panangaden, и M. Rowland. CoRR, (2021)Geometrically Coupled Monte Carlo Sampling.M. Rowland, K. Choromanski, F. Chalus, A. Pacchiano, T. Sarlós, R. Turner, и A. Weller. NeurIPS, стр. 195-205. (2018)On the Effect of Auxiliary Tasks on Representation Dynamics.C. Lyle, M. Rowland, G. Ostrovski, и W. Dabney. AISTATS, том 130 из Proceedings of Machine Learning Research, стр. 1-9. PMLR, (2021)Marginalized Operators for Off-policy Reinforcement Learning.Y. Tang, M. Rowland, R. Munos, и M. Valko. AISTATS, том 151 из Proceedings of Machine Learning Research, стр. 655-679. PMLR, (2022)

Что такое BibSonomy?: С чего начать; Кнопки для браузера; Помощь
Разработчикам: Обзор; API-документация

Контакт и защита личных данных: о нас; Cookies; Сообщить о проблеме; BibSonomy Вики

Интеграция: PUMA; Расширение для TYPO3; Плагин для; Клиент Java REST; Поддерживаемые источники; далее

О BibSonomy: Команда; Блог; Список рассылки
Социальные сети: Наш Twitter