Autor der Publikation

Empirical Algorithms for General Stochastic Systems with Continuous States and Actions.

, , und . CDC, Seite 6344-6349. IEEE, (2019)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Approximate Relative Value Learning for Average-reward Continuous State MDPs., , und . UAI, Volume 115 von Proceedings of Machine Learning Research, Seite 956-964. AUAI Press, (2019)Model-free Reinforcement Learning in Infinite-horizon Average-reward Markov Decision Processes., , , , und . ICML, Volume 119 von Proceedings of Machine Learning Research, Seite 10170-10180. PMLR, (2020)Empirical Algorithms for General Stochastic Systems with Continuous States and Actions., , und . CDC, Seite 6344-6349. IEEE, (2019)Phi-3 Safety Post-Training: Aligning Language Models with a "Break-Fix" Cycle., , , , , , , , , und 20 andere Autor(en). CoRR, (2024)Optimal Spectrum Sensing for Cognitive Radio with Imperfect Detector., , , und . VTC Spring, Seite 1-5. IEEE, (2014)Cost-Effective Proxy Reward Model Construction with On-Policy and Active Learning., , , , , , , , und . CoRR, (2024)Self-Exploring Language Models: Active Preference Elicitation for Online Alignment., , , , , , und . CoRR, (2024)Randomized function fitting-based empirical value iteration., , , und . CDC, Seite 2467-2472. IEEE, (2017)Finite Time Guarantees for Continuous State MDPs with Generative Model., und . CDC, Seite 3617-3622. IEEE, (2020)An Empirical Relative Value Learning Algorithm for Non-parametric MDPs with Continuous State Space., , und . ECC, Seite 1368-1373. IEEE, (2019)