Artikel,

Distributional Soft Actor-Critic: Off-Policy Reinforcement Learning for Addressing Value Estimation Errors.

, , , , , und .
IEEE Trans. Neural Networks Learn. Syst., 33 (11): 6584-6598 (2022)

Metadaten

Tags

Nutzer

  • @dblp

Kommentare und Rezensionen