Artikel,

Ranked Reward: Enabling Self-Play Reinforcement Learning for Combinatorial Optimization.

A. Laterre, Y. Fu, M. Jabri, A. Cohen, D. Kas, K. Hajjar, T. Dahl, A. Kerkeni, und K. Beguir.
CoRR, (2018)

Metadaten

BibTeX-Schlüssel: journals/corr/abs-1807-01672
Eintragstyp: article
Jahr: 2018
Zeitschrift: CoRR
Band: abs/1807.01672
ee: http://arxiv.org/abs/1807.01672
URL: http://dblp.uni-trier.de/db/journals/corr/corr1807.html#abs-1807-01672

Tags

dblp

Nutzer

Kommentare und Rezensionenanzeigen / verbergen

Bitte melden Sie sich an um selbst Rezensionen oder Kommentare zu erstellen.

Zitieren Sie diese Publikation

Suchen auf