Autor der Publikation

Trust Region Meta Learning for Policy Optimization.

, , , und . Meta-Knowledge Transfer @ ECML/PKDD, Volume 191 von Proceedings of Machine Learning Research, Seite 62-74. PMLR, (2022)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Gradient-Aware Model-Based Policy Search., , , , und . AAAI, Seite 3801-3808. AAAI Press, (2020)Optimistic Policy Optimization via Multiple Importance Sampling., , , und . ICML, Volume 97 von Proceedings of Machine Learning Research, Seite 4989-4999. PMLR, (2019)Balancing Sample Efficiency and Suboptimality in Inverse Reinforcement Learning., , , und . ICML, Volume 162 von Proceedings of Machine Learning Research, Seite 4618-4629. PMLR, (2022)Multi-Fidelity Best-Arm Identification., , und . NeurIPS, (2022)Learning in Non-Cooperative Configurable Markov Decision Processes., , , und . NeurIPS, Seite 22808-22821. (2021)A Provably Efficient Option-Based Algorithm for both High-Level and Low-Level Learning., , und . CoRR, (2024)Graph-Triggered Rising Bandits., , , , , und . ICML, OpenReview.net, (2024)No-Regret Reinforcement Learning in Smooth MDPs., , , und . ICML, OpenReview.net, (2024)Compatible Reward Inverse Reinforcement Learning., , und . NIPS, Seite 2050-2059. (2017)On the Relation between Policy Improvement and Off-Policy Minimum-Variance Policy Evaluation., , und . UAI, Volume 216 von Proceedings of Machine Learning Research, Seite 1423-1433. PMLR, (2023)