Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Unfamiliar Finetuning Examples Control How Language Models Hallucinate., , , , und . CoRR, (2024)Chaining Behaviors from Data with Model-Free Reinforcement Learning., , , , , und . CoRL, Volume 155 von Proceedings of Machine Learning Research, Seite 2162-2177. PMLR, (2020)RL on Incorrect Synthetic Data Scales the Efficiency of LLM Math Reasoning by Eight-Fold., , , , , und . CoRR, (2024)Q-Transformer: Scalable Offline Reinforcement Learning via Autoregressive Q-Functions., , , , , , , , , und 15 andere Autor(en). CoRL, Volume 229 von Proceedings of Machine Learning Research, Seite 3909-3928. PMLR, (2023)Zero-Shot Robotic Manipulation with Pre-Trained Image-Editing Diffusion Models., , , , , , und . ICLR, OpenReview.net, (2024)Latent Conservative Objective Models for Data-Driven Crystal Structure Prediction., , , , , und . CoRR, (2023)Conservative Data Sharing for Multi-Task Offline Reinforcement Learning., , , , , und . NeurIPS, Seite 11501-11516. (2021)COMBO: Conservative Offline Model-Based Policy Optimization., , , , , und . NeurIPS, Seite 28954-28967. (2021)Conservative Q-Learning for Offline Reinforcement Learning., , , und . NeurIPS, (2020)Conservative Safety Critics for Exploration., , , , , und . ICLR, OpenReview.net, (2021)