Artikel,

Distributional Soft Actor-Critic: Off-Policy Reinforcement Learning for Addressing Value Estimation Errors.

J. Duan, Y. Guan, S. Li, Y. Ren, Q. Sun, und B. Cheng.
IEEE Trans. Neural Networks Learn. Syst., 33 (11): 6584-6598 (2022)

Metadaten

BibTeX-Schlüssel: journals/tnn/DuanGLRSC22
Eintragstyp: article
Jahr: 2022
Zeitschrift: IEEE Trans. Neural Networks Learn. Syst.
Nummer: 11
Seiten: 6584-6598
Band: 33
ee: https://doi.org/10.1109/TNNLS.2021.3082568
URL: http://dblp.uni-trier.de/db/journals/tnn/tnn33.html#DuanGLRSC22

Tags

dblp

Nutzer

Kommentare und Rezensionenanzeigen / verbergen

Bitte melden Sie sich an um selbst Rezensionen oder Kommentare zu erstellen.

Zitieren Sie diese Publikation

Suchen auf