From post

копировать удалить добавить публикацию в буфер
Запись сообщества
посмотреть историю данной записи
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Model-free Posterior Sampling via Learning Rate Randomization.

D. Tiapkin, D. Belomestny, D. Calandriello, E. Moulines, R. Munos, A. Naumov, P. Perrault, M. Valko, и P. Ménard. CoRR, (2023)

Please choose a person to relate this publication to

To differ between persons with the same name, the academic degree and the title of an important publication will be displayed.

Rolf Rémi

Rémi Auguste

Rémi Revire

Rémi Dorat

Rémi Flamary

Другие публикации лиц с тем же именем

World Discovery Models.M. Azar, B. Piot, B. Pires, J. Grill, F. Altché, и R. Munos. CoRR, (2019)Minimax Regret Bounds for Reinforcement Learning.M. Azar, I. Osband, и R. Munos. ICML, том 70 из Proceedings of Machine Learning Research, стр. 263-272. PMLR, (2017)Fast LSTD Using Stochastic Approximation: Finite Time Analysis and Application to Traffic Control.P. A., N. Korda, и R. Munos. ECML/PKDD (2), том 8725 из Lecture Notes in Computer Science, стр. 66-81. Springer, (2014)Variable Resolution Discretization for High-Accuracy Solutions of Optimal Control Problems.R. Munos, и A. Moore. IJCAI, стр. 1348-1355. Morgan Kaufmann, (1999)Sample Efficient Actor-Critic with Experience Replay.Z. Wang, V. Bapst, N. Heess, V. Mnih, R. Munos, K. Kavukcuoglu, и N. de Freitas. ICLR (Poster), OpenReview.net, (2017)Combining policy gradient and Q-learning.B. O'Donoghue, R. Munos, K. Kavukcuoglu, и V. Mnih. ICLR (Poster), OpenReview.net, (2017)Geometric Variance Reduction in Markov Chains: Application to Value Function and Gradient Estimation.R. Munos. J. Mach. Learn. Res., (2006)Sensitivity Analysis Using Ito-circumflex--Malliavin Calculus and Martingales, and Application to Stochastic Optimal Control.E. Gobet, и R. Munos. SIAM J. Control and Optimization, 43 (5): 1676-1713 (2005)The Uncertainty Bellman Equation and Exploration.B. O'Donoghue, I. Osband, R. Munos, и V. Mnih. CoRR, (2017)PGQ: Combining policy gradient and Q-learning.B. O'Donoghue, R. Munos, K. Kavukcuoglu, и V. Mnih. CoRR, (2016)

Что такое BibSonomy?: С чего начать; Кнопки для браузера; Помощь
Разработчикам: Обзор; API-документация

Контакт и защита личных данных: о нас; Cookies; Сообщить о проблеме; BibSonomy Вики

Интеграция: PUMA; Расширение для TYPO3; Плагин для; Клиент Java REST; Поддерживаемые источники; далее

О BibSonomy: Команда; Блог; Список рассылки
Социальные сети: Наш Twitter