Autor der Publikation

Risk aversion in finite Markov Decision Processes using total cost criteria and average value at risk.

, , und . ICRA, Seite 335-342. IEEE, (2016)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Dynamic Planning in Open-Ended Dialogue using Reinforcement Learning., , , , , , , , , und 1 andere Autor(en). CoRR, (2022)Safe Policy Learning for Continuous Control., , , , und . CoRL, Volume 155 von Proceedings of Machine Learning Research, Seite 801-821. PMLR, (2020)DualDICE: Behavior-Agnostic Estimation of Discounted Stationary Distribution Corrections., , , und . NeurIPS, Seite 2315-2325. (2019)Risk-Sensitive and Robust Decision-Making: a CVaR Optimization Approach., , , und . NIPS, Seite 1522-1530. (2015)Variational Model-based Policy Optimization., , , und . IJCAI, Seite 2292-2299. ijcai.org, (2021)Risk aversion in finite Markov Decision Processes using total cost criteria and average value at risk., , und . ICRA, Seite 335-342. IEEE, (2016)Risk-Sensitive Generative Adversarial Imitation Learning., , , und . AISTATS, Volume 89 von Proceedings of Machine Learning Research, Seite 2154-2163. PMLR, (2019)Sequential Multiple Hypothesis Testing with Type I Error Control., , , und . AISTATS, Volume 54 von Proceedings of Machine Learning Research, Seite 1468-1476. PMLR, (2017)Prediction, Consistency, Curvature: Representation Learning for Locally-Linear Control., , , , , und . ICLR, OpenReview.net, (2020)AlgaeDICE: Policy Gradient from Arbitrary Experience., , , , , und . CoRR, (2019)