Inproceedings,

Sample-Efficient Reinforcement Learning Based on Dynamics Models via Meta-policy Optimization.

G. Zuo, Z. Tian, S. Huang, and D. Gong.
ICCSIP, volume 1515 of Communications in Computer and Information Science, page 360-373. Springer, (2021)

Meta data

BibTeX key: conf/iccsip/ZuoTHG21
entry type: inproceedings
booktitle: ICCSIP
year: 2021
pages: 360-373
publisher: Springer
series: Communications in Computer and Information Science
volume: 1515
crossref: conf/iccsip/2021
ee: https://doi.org/10.1007/978-981-16-9247-5_28
isbn: 978-981-16-9247-5
url: http://dblp.uni-trier.de/db/conf/iccsip/iccsip2021.html#ZuoTHG21

Tags

dblp

Users

Comments and Reviewsshow / hide

Please log in to take part in the discussion (add own reviews or comments).

Cite this publication

search on