Techreport,

Reinforcement Learning with High-Dimensional Continuous Actions

L. Baird, and H. Klopf.
WL-TR-93-1147. Wright Laboratory, Wright-Patterson Air Force Base, (1993)

Meta data

BibTeX key: baird:tech
entry type: techreport
year: 1993
institution: Wright Laboratory, Wright-Patterson Air Force Base
number: WL-TR-93-1147
priority: 2
citeulike-article-id: 2380171

Tags

inaki

Users

Comments and Reviewsshow / hide

Please log in to take part in the discussion (add own reviews or comments).

Cite this publication

search on