Autor der Publikation

REPAINT: Knowledge Transfer in Deep Reinforcement Learning.

, , , , und . ICML, Volume 139 von Proceedings of Machine Learning Research, Seite 10141-10152. PMLR, (2021)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Cloud-based model predictive building thermostatic controls of commercial buildings: Algorithm and implementation., , , , und . ACC, Seite 1683-1688. IEEE, (2015)Parametric system identification using deep convolutional neural networks.. IJCNN, Seite 2112-2119. IEEE, (2017)Prediction of mortality from respiratory distress among long-term mechanically ventilated patients., und . EMBC, Seite 3464-3467. IEEE, (2014)On diagnosis and predictability of partially-observed discrete -event systems.. University of Michigan, USA, (2006)Measuring Sample Efficiency and Generalization in Reinforcement Learning Benchmarks: NeurIPS 2020 Procgen Benchmark., , , , , , , , , und 13 andere Autor(en). NeurIPS (Competition and Demos), Volume 133 von Proceedings of Machine Learning Research, Seite 361-395. PMLR, (2020)Gated Transformer for Decoding Human Brain EEG Signals., , , , , , , , und . EMBC, Seite 125-130. IEEE, (2021)A coordinated optimization approach to Volt/VAr control for large power distribution networks., und . ACC, Seite 1145-1150. IEEE, (2011)Continuous remote vital sign/environment monitoring for returning soldier adjustment assessment., , , , , und . EMBC, Seite 2216-2219. IEEE, (2011)Distributed Diagnosis of Discrete-Event Systems Using Petri Nets., und . ICATPN, Volume 2679 von Lecture Notes in Computer Science, Seite 316-336. Springer, (2003)REPAINT: Knowledge Transfer in Deep Actor-Critic Reinforcement Learning., , , und . CoRR, (2020)