Autor der Publikation

Striving for Simplicity and Performance in Off-Policy DRL: Output Normalization and Non-Uniform Sampling.

, , , und . ICML, Volume 119 von Proceedings of Machine Learning Research, Seite 10070-10080. PMLR, (2020)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

A Comprehensive Network Restoration Model for Active Distribution Network Considering Forecast Uncertainty., , , , , , und . IEEE Access, (2021)BAIL: Best-Action Imitation Learning for Batch Deep Reinforcement Learning., , , , , , und . CoRR, (2019)On the Convergence of the Monte Carlo Exploring Starts Algorithm for Reinforcement Learning., und . CoRR, (2020)Boosting Soft Actor-Critic: Emphasizing Recent Experience without Forgetting the Past., und . CoRR, (2019)Accurate, Diverse and Multiple Distractor Generation with Mixture of Experts., , und . NLPCC (1), Volume 14302 von Lecture Notes in Computer Science, Seite 761-773. Springer, (2023)BAIL: Best-Action Imitation Learning for Batch Deep Reinforcement Learning., , , , , und . NeurIPS, (2020)Magnetically actuated gearbox for the wireless control of millimeter-scale robots., , , , , , , und . Sci. Robotics, (2022)Randomized Ensembled Double Q-Learning: Learning Fast Without a Model., , , und . ICLR, OpenReview.net, (2021)On the Convergence of the Monte Carlo Exploring Starts Algorithm for Reinforcement Learning., , , und . ICLR, OpenReview.net, (2022)Robust multi-agent reinforcement learning via Bayesian distributional value estimation., , , , , , , und . Pattern Recognit., (Januar 2024)