Autor der Publikation

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Striving for Simplicity and Performance in Off-Policy DRL: Output Normalization and Non-Uniform Sampling.

C. Wang, Y. Wu, Q. Vuong, und K. Ross. ICML, Volume 119 von Proceedings of Machine Learning Research, Seite 10070-10080. PMLR, (2020)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

Che Lim

Mingcheng Che

Austin Che

Guangzhou Che

Haiyan Che

Weitere Publikationen von Autoren mit dem selben Namen

A Comprehensive Network Restoration Model for Active Distribution Network Considering Forecast Uncertainty.G. Wang, X. Lei, H. Wu, K. Sun, L. Wang, Y. Ding, und C. Wang. IEEE Access, (2021)BAIL: Best-Action Imitation Learning for Batch Deep Reinforcement Learning.X. Chen, Z. Zhou, Z. Wang, C. Wang, Y. Wu, Q. Deng, und K. Ross. CoRR, (2019)On the Convergence of the Monte Carlo Exploring Starts Algorithm for Reinforcement Learning.C. Wang, und K. Ross. CoRR, (2020)Boosting Soft Actor-Critic: Emphasizing Recent Experience without Forgetting the Past.C. Wang, und K. Ross. CoRR, (2019)Accurate, Diverse and Multiple Distractor Generation with Mixture of Experts.F. Qu, C. Wang, und Y. Wu. NLPCC (1), Volume 14302 von Lecture Notes in Computer Science, Seite 761-773. Springer, (2023)BAIL: Best-Action Imitation Learning for Batch Deep Reinforcement Learning.X. Chen, Z. Zhou, Z. Wang, C. Wang, Y. Wu, und K. Ross. NeurIPS, (2020)Magnetically actuated gearbox for the wireless control of millimeter-scale robots.C. Hong, Z. Ren, C. Wang, M. Li, Y. Wu, D. Tang, W. Hu, und M. Sitti. Sci. Robotics, (2022)Randomized Ensembled Double Q-Learning: Learning Fast Without a Model.X. Chen, C. Wang, Z. Zhou, und K. Ross. ICLR, OpenReview.net, (2021)On the Convergence of the Monte Carlo Exploring Starts Algorithm for Reinforcement Learning.C. Wang, S. Yuan, K. Shao, und K. Ross. ICLR, OpenReview.net, (2022)Robust multi-agent reinforcement learning via Bayesian distributional value estimation.X. Du, H. Chen, C. Wang, Y. Xing, J. Yang, P. Yu, Y. Chang, und L. He. Pattern Recognit., (Januar 2024)

BibSonomy

Disambiguierung von "Wang, Che"

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Striving for Simplicity and Performance in Off-Policy DRL: Output Normalization and Non-Uniform Sampling.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Che Lim

Mingcheng Che

Austin Che

Guangzhou Che

Haiyan Che

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

BibSonomy

Disambiguierung von "Wang, Che"

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML Striving for Simplicity and Performance in Off-Policy DRL: Output Normalization and Non-Uniform Sampling.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Che Lim

Mingcheng Che

Austin Che

Guangzhou Che

Haiyan Che

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Striving for Simplicity and Performance in Off-Policy DRL: Output Normalization and Non-Uniform Sampling.