Autor der Publikation

Pareto Front Identification from Stochastic Bandit Feedback.

, , , und . AISTATS, Volume 51 von JMLR Workshop and Conference Proceedings, Seite 939-947. JMLR.org, (2016)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Regret bounds for restless Markov bandits., , , und . Theor. Comput. Sci., (2014)Online Regret Bounds for Markov Decision Processes with Deterministic Transitions.. ALT, Volume 5254 von Lecture Notes in Computer Science, Seite 123-137. Springer, (2008)Exploiting Similarity Information in Reinforcement Learning - Similarity Models for Multi-Armed Bandits and MDPs.. ICAART (1), Seite 203-210. INSTICC Press, (2010)Variational Regret Bounds for Reinforcement Learning., , und . UAI, Volume 115 von Proceedings of Machine Learning Research, Seite 81-90. AUAI Press, (2019)Regret Bounds for Learning State Representations in Reinforcement Learning., , , , und . NeurIPS, Seite 12717-12727. (2019)Improved Rates for the Stochastic Continuum-Armed Bandit Problem., , und . COLT, Volume 4539 von Lecture Notes in Computer Science, Seite 454-468. Springer, (2007)Pseudometrics for State Aggregation in Average Reward Markov Decision Processes.. ALT, Volume 4754 von Lecture Notes in Computer Science, Seite 373-387. Springer, (2007)Autonomous Exploration for Navigating in MDPs Using Blackbox RL Algorithms., , und . IJCAI, Seite 3714-3722. ijcai.org, (2023)Achieving Optimal Dynamic Regret for Non-stationary Bandits without Prior Information., , , , , , und . COLT, Volume 99 von Proceedings of Machine Learning Research, Seite 159-163. PMLR, (2019)Pareto Front Identification from Stochastic Bandit Feedback., , , und . AISTATS, Volume 51 von JMLR Workshop and Conference Proceedings, Seite 939-947. JMLR.org, (2016)