Autor der Publikation

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Offline Meta-Reinforcement Learning with Advantage Weighting.

E. Mitchell, R. Rafailov, X. Peng, S. Levine, und C. Finn. ICML, Volume 139 von Proceedings of Machine Learning Research, Seite 7780-7791. PMLR, (2021)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

Rafael Plonka

Impact of the interface on the paraelectric-to-ferroelectric phase transition in epitaxial BaSrTiO_tn3 thin film capacitorsR. Plonka. TU Aachen, (2007)

Rafael Weber

Rafael Bielmeier

Rafael Capurro

Rafael Reinhardt

Weitere Publikationen von Autoren mit dem selben Namen

Diffusion Model Alignment Using Direct Preference Optimization.B. Wallace, M. Dang, R. Rafailov, L. Zhou, A. Lou, S. Purushwalkam, S. Ermon, C. Xiong, S. Joty, und N. Naik. CoRR, (2023)Direct Preference Optimization: Your Language Model is Secretly a Reward ModelR. Rafailov, A. Sharma, E. Mitchell, S. Ermon, C. Manning, und C. Finn. (2023)MJ-Bench: Is Your Multimodal Reward Model Really a Good Judge for Text-to-Image Generation?Z. Chen, Y. Du, Z. Wen, Y. Zhou, C. Cui, Z. Weng, H. Tu, C. Wang, Z. Tong, Q. Huang und 9 andere Autor(en). CoRR, (2024)Disentangling Length from Quality in Direct Preference Optimization.R. Park, R. Rafailov, S. Ermon, und C. Finn. ACL (Findings), Seite 4998-5017. Association for Computational Linguistics, (2024)MOTO: Offline Pre-training to Online Fine-tuning for Model-based Robot Learning.R. Rafailov, K. Hatch, V. Kolev, J. Martin, M. Phielipp, und C. Finn. CoRL, Volume 229 von Proceedings of Machine Learning Research, Seite 3654-3671. PMLR, (2023)Just Ask for Calibration: Strategies for Eliciting Calibrated Confidence Scores from Language Models Fine-Tuned with Human Feedback.K. Tian, E. Mitchell, A. Zhou, A. Sharma, R. Rafailov, H. Yao, C. Finn, und C. Manning. EMNLP, Seite 5433-5442. Association for Computational Linguistics, (2023)Visual Adversarial Imitation Learning using Variational Models.R. Rafailov, T. Yu, A. Rajeswaran, und C. Finn. NeurIPS, Seite 3016-3028. (2021)OpenVLA: An Open-Source Vision-Language-Action Model.M. Kim, K. Pertsch, S. Karamcheti, T. Xiao, A. Balakrishna, S. Nair, R. Rafailov, E. Foster, G. Lam, P. Sanketi und 8 andere Autor(en). CoRR, (2024)Open X-Embodiment: Robotic Learning Datasets and RT-X Models : Open X-Embodiment Collaboration.A. O'Neill, A. Rehman, A. Maddukuri, A. Gupta, A. Padalkar, A. Lee, A. Pooley, A. Gupta, A. Mandlekar, A. Jain und 269 andere Autor(en). ICRA, Seite 6892-6903. IEEE, (2024)Offline Reinforcement Learning from Images with Latent Space Models.R. Rafailov, T. Yu, A. Rajeswaran, und C. Finn. CoRR, (2020)

BibSonomy

Disambiguierung von "Rafailov, Rafael"

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Offline Meta-Reinforcement Learning with Advantage Weighting.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Rafael Plonka

Rafael Weber

Rafael Bielmeier

Rafael Capurro

Rafael Reinhardt

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

BibSonomy

Disambiguierung von "Rafailov, Rafael"

KopierenLöschenDiese Publikation zur Ablage hinzufügenCommunity-EintragVersionsverlauf dieses EintragsURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML Offline Meta-Reinforcement Learning with Advantage Weighting.

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Rafael Plonka

Rafael Weber

Rafael Bielmeier

Rafael Capurro

Rafael Reinhardt

Weitere Publikationen von Autoren mit dem selben Namen

Disambiguierung

Kopieren Löschen Diese Publikation zur Ablage hinzufügen
Community-Eintrag
Versionsverlauf dieses Eintrags
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Offline Meta-Reinforcement Learning with Advantage Weighting.