Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

One Policy is Enough: Parallel Exploration with a Single Policy is Minimax Optimal for Reward-Free Reinforcement Learning.

P. Cisneros-Velarde, B. Lyu, S. Koyejo, und M. Kolar. CoRR, (2022)

Links und Ressourcen

BibTeX-Schlüssel: journals/corr/abs-2205-15891
Eintragstyp: article
Jahr: 2022
Zeitschrift: CoRR
Band: abs/2205.15891
ee: https://doi.org/10.48550/arXiv.2205.15891
URL: http://dblp.uni-trier.de/db/journals/corr/corr2205.html#abs-2205-15891

Tags

Zitieren Sie diese Publikation

Suchen auf

Metadaten

Zuletzt geändert vor einem Monat
Erstellt vor 2 Jahren

Kommentare und Rezensionen
(0)

Es gibt bisher keine Rezension oder Kommentar. Sie können eine schreiben!