Autor der Publikation

Open Problem: Model Selection for Contextual Bandits.

, , und . COLT, Volume 125 von Proceedings of Machine Learning Research, Seite 3842-3846. PMLR, (2020)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Achieving All with No Parameters: Adaptive NormalHedge., und . CoRR, (2015)More Adaptive Algorithms for Adversarial Bandits., und . COLT, Volume 75 von Proceedings of Machine Learning Research, Seite 1263-1291. PMLR, (2018)Adversarial Online Learning with Changing Action Sets: Efficient Algorithms with Approximate Regret Bounds., , , und . CoRR, (2020)New lower bounds of fifteen classical Ramsey numbers., , , und . Australas. J Comb., (1999)Variance-Reduced and Projection-Free Stochastic Optimization., und . ICML, Volume 48 von JMLR Workshop and Conference Proceedings, Seite 1263-1271. JMLR.org, (2016)Beating Stochastic and Adversarial Semi-bandits Optimally and Simultaneously., , und . ICML, Volume 97 von Proceedings of Machine Learning Research, Seite 7683-7692. PMLR, (2019)Adaptive Resource Provisioning for the Cloud Using Online Bin Packing., , , und . IEEE Trans. Computers, 63 (11): 2647-2660 (2014)Learning Infinite-Horizon Average-Reward Markov Decision Processes with Constraints., , und . CoRR, (2022)Improved High-Probability Regret for Adversarial Bandits with Time-Varying Feedback Graphs., , , und . CoRR, (2022)WizardMath: Empowering Mathematical Reasoning for Large Language Models via Reinforced Evol-Instruct., , , , , , , , , und . CoRR, (2023)