Autor der Publikation

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Empirical Algorithms for General Stochastic Systems with Continuous States and Actions.

H. Sharma, R. Jain, und W. Haskell. CDC, Seite 6344-6349. IEEE, (2019)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

Krishna Sharma

Tripti Sharma

Anuradha Sharma

Monica Sharma

Shatrughan Sharma

Weitere Publikationen von Autoren mit dem selben Namen

Approximate Relative Value Learning for Average-reward Continuous State MDPs.H. Sharma, M. Jafarnia-Jahromi, und R. Jain. UAI, Volume 115 von Proceedings of Machine Learning Research, Seite 956-964. AUAI Press, (2019)Model-free Reinforcement Learning in Infinite-horizon Average-reward Markov Decision Processes.C. Wei, M. Jafarnia-Jahromi, H. Luo, H. Sharma, und R. Jain. ICML, Volume 119 von Proceedings of Machine Learning Research, Seite 10170-10180. PMLR, (2020)Empirical Algorithms for General Stochastic Systems with Continuous States and Actions.H. Sharma, R. Jain, und W. Haskell. CDC, Seite 6344-6349. IEEE, (2019)Phi-3 Safety Post-Training: Aligning Language Models with a "Break-Fix" Cycle.E. Haider, D. Perez-Becker, T. Portet, P. Madan, A. Garg, D. Majercak, W. Wen, D. Kim, Z. Yang, J. Zhang und 20 andere Autor(en). CoRR, (2024)Optimal Spectrum Sensing for Cognitive Radio with Imperfect Detector.H. Sharma, A. Patel, S. Merchant, und U. Desai. VTC Spring, Seite 1-5. IEEE, (2014)Cost-Effective Proxy Reward Model Construction with On-Policy and Active Learning.Y. Chen, S. Wang, Z. Yang, H. Sharma, N. Karampatziakis, D. Yu, K. Jamieson, S. Du, und Y. Shen. CoRR, (2024)Self-Exploring Language Models: Active Preference Elicitation for Online Alignment.S. Zhang, D. Yu, H. Sharma, Z. Yang, S. Wang, H. Hassan, und Z. Wang. CoRR, (2024)Randomized function fitting-based empirical value iteration.W. Haskell, P. Yu, H. Sharma, und R. Jain. CDC, Seite 2467-2472. IEEE, (2017)Finite Time Guarantees for Continuous State MDPs with Generative Model.H. Sharma, und R. Jain. CDC, Seite 3617-3622. IEEE, (2020)An Empirical Relative Value Learning Algorithm for Non-parametric MDPs with Continuous State Space.H. Sharma, R. Jain, und A. Gupta. ECC, Seite 1368-1373. IEEE, (2019)

BibSonomy

Disambiguierung von "Sharma, Hiteshi"

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Empirical Algorithms for General Stochastic Systems with Continuous States and Actions.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Krishna Sharma

Tripti Sharma

Anuradha Sharma

Monica Sharma

Shatrughan Sharma

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

BibSonomy

Disambiguierung von "Sharma, Hiteshi"

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML Empirical Algorithms for General Stochastic Systems with Continuous States and Actions.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Krishna Sharma

Tripti Sharma

Anuradha Sharma

Monica Sharma

Shatrughan Sharma

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Empirical Algorithms for General Stochastic Systems with Continuous States and Actions.