From post

копировать удалить добавить публикацию в буфер
Запись сообщества
посмотреть историю данной записи
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Balancing Learning Speed and Stability in Policy Gradient via Adaptive Exploration.

M. Papini, A. Battistello, и M. Restelli. AISTATS, том 108 из Proceedings of Machine Learning Research, стр. 1188-1199. PMLR, (2020)

Please choose a person to relate this publication to

To differ between persons with the same name, the academic degree and the title of an important publication will be displayed.

Matteo Garavoglia

Matteo Gabba

Matteo Rini

Matteo Bertini

Marco Matteo

Другие публикации лиц с тем же именем

Feature Selection via Mutual Information: New Theoretical Insights.M. Beraha, A. Metelli, M. Papini, A. Tirinzoni, и M. Restelli. IJCNN, стр. 1-9. IEEE, (2019)Offline Primal-Dual Reinforcement Learning for Linear MDPs.G. Gabbianelli, G. Neu, M. Papini, и N. Okolo. AISTATS, том 238 из Proceedings of Machine Learning Research, стр. 3169-3177. PMLR, (2024)Safe policy optimization.M. Papini. Polytechnic University of Milan, Italy, (2021)Balancing Learning Speed and Stability in Policy Gradient via Adaptive Exploration.M. Papini, A. Battistello, и M. Restelli. AISTATS, том 108 из Proceedings of Machine Learning Research, стр. 1188-1199. PMLR, (2020)Automated Reasoning for Reinforcement Learning Agents in Structured Environments.A. Gianola, M. Montali, и M. Papini. OVERLAY@GandALF, том 2987 из CEUR Workshop Proceedings, стр. 43-48. CEUR-WS.org, (2021)Smoothing Policies and Safe Policy Gradients.M. Papini, M. Pirotta, и M. Restelli. CoRR, (2019)Risk-Averse Trust Region Optimization for Reward-Volatility Reduction.L. Bisi, L. Sabbioni, E. Vittori, M. Papini, и M. Restelli. CoRR, (2019)Gradient-Aware Model-Based Policy Search.P. D'Oro, A. Metelli, A. Tirinzoni, M. Papini, и M. Restelli. AAAI, стр. 3801-3808. AAAI Press, (2020)Optimistic Policy Optimization via Multiple Importance Sampling.M. Papini, A. Metelli, L. Lupo, и M. Restelli. ICML, том 97 из Proceedings of Machine Learning Research, стр. 4989-4999. PMLR, (2019)No-Regret Reinforcement Learning in Smooth MDPs.D. Maran, A. Metelli, M. Papini, и M. Restelli. ICML, OpenReview.net, (2024)

BibSonomy

Disambiguation