Autor der Publikation

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Open Problem: Model Selection for Contextual Bandits.

D. Foster, A. Krishnamurthy, und H. Luo. COLT, Volume 125 von Proceedings of Machine Learning Research, Seite 3842-3846. PMLR, (2020)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

Haipeng Ding

Haipeng Jing

Haipeng Song

Jia Luo

Xiaoguang Luo

Weitere Publikationen von Autoren mit dem selben Namen

Achieving All with No Parameters: Adaptive NormalHedge.H. Luo, und R. Schapire. CoRR, (2015)More Adaptive Algorithms for Adversarial Bandits.C. Wei, und H. Luo. COLT, Volume 75 von Proceedings of Machine Learning Research, Seite 1263-1291. PMLR, (2018)Adversarial Online Learning with Changing Action Sets: Efficient Algorithms with Approximate Regret Bounds.E. Emamjomeh-Zadeh, C. Wei, H. Luo, und D. Kempe. CoRR, (2020)New lower bounds of fifteen classical Ramsey numbers.W. Su, H. Luo, Z. Zhang, und G. Li. Australas. J Comb., (1999)Variance-Reduced and Projection-Free Stochastic Optimization.E. Hazan, und H. Luo. ICML, Volume 48 von JMLR Workshop and Conference Proceedings, Seite 1263-1271. JMLR.org, (2016)Beating Stochastic and Adversarial Semi-bandits Optimally and Simultaneously.J. Zimmert, H. Luo, und C. Wei. ICML, Volume 97 von Proceedings of Machine Learning Research, Seite 7683-7692. PMLR, (2019)Adaptive Resource Provisioning for the Cloud Using Online Bin Packing.W. Song, Z. Xiao, Q. Chen, und H. Luo. IEEE Trans. Computers, 63 (11): 2647-2660 (2014)Learning Infinite-Horizon Average-Reward Markov Decision Processes with Constraints.L. Chen, R. Jain, und H. Luo. CoRR, (2022)Improved High-Probability Regret for Adversarial Bandits with Time-Varying Feedback Graphs.H. Luo, H. Tong, M. Zhang, und Y. Zhang. CoRR, (2022)WizardMath: Empowering Mathematical Reasoning for Large Language Models via Reinforced Evol-Instruct.H. Luo, Q. Sun, C. Xu, P. Zhao, J. Lou, C. Tao, X. Geng, Q. Lin, S. Chen, und D. Zhang. CoRR, (2023)

BibSonomy

Disambiguierung von "Luo, Haipeng"

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Open Problem: Model Selection for Contextual Bandits.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Haipeng Ding

Haipeng Jing

Haipeng Song

Jia Luo

Xiaoguang Luo

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

BibSonomy

Disambiguierung von "Luo, Haipeng"

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML Open Problem: Model Selection for Contextual Bandits.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Haipeng Ding

Haipeng Jing

Haipeng Song

Jia Luo

Xiaoguang Luo

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Open Problem: Model Selection for Contextual Bandits.