From post

копировать удалить добавить публикацию в буфер
Запись сообщества
посмотреть историю данной записи
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Calibration of Encoder Decoder Models for Neural Machine Translation.

A. Kumar, и S. Sarawagi. CoRR, (2019)

Please choose a person to relate this publication to

To differ between persons with the same name, the academic degree and the title of an important publication will be displayed.

Aviral Shrot

Rohini Kumar

Aditya Kumar

Podiyanachari Santhosh Kumar

Pardeep Kumar

Другие публикации лиц с тем же именем

Unfamiliar Finetuning Examples Control How Language Models Hallucinate.K. Kang, E. Wallace, C. Tomlin, A. Kumar, и S. Levine. CoRR, (2024)Chaining Behaviors from Data with Model-Free Reinforcement Learning.A. Singh, A. Yu, J. Yang, J. Zhang, A. Kumar, и S. Levine. CoRL, том 155 из Proceedings of Machine Learning Research, стр. 2162-2177. PMLR, (2020)Q-Transformer: Scalable Offline Reinforcement Learning via Autoregressive Q-Functions.Y. Chebotar, Q. Vuong, K. Hausman, F. Xia, Y. Lu, A. Irpan, A. Kumar, T. Yu, A. Herzog, K. Pertsch и 15 other автор(ы). CoRL, том 229 из Proceedings of Machine Learning Research, стр. 3909-3928. PMLR, (2023)RL on Incorrect Synthetic Data Scales the Efficiency of LLM Math Reasoning by Eight-Fold.A. Setlur, S. Garg, X. Geng, N. Garg, V. Smith, и A. Kumar. CoRR, (2024)Zero-Shot Robotic Manipulation with Pre-Trained Image-Editing Diffusion Models.K. Black, M. Nakamoto, P. Atreya, H. Walke, C. Finn, A. Kumar, и S. Levine. ICLR, OpenReview.net, (2024)Calibration of Encoder Decoder Models for Neural Machine Translation.A. Kumar, и S. Sarawagi. CoRR, (2019)Latent Conservative Objective Models for Data-Driven Crystal Structure Prediction.H. Qi, X. Geng, S. Rando, I. Ohama, A. Kumar, и S. Levine. CoRR, (2023)Diagnosing Bottlenecks in Deep Q-learning Algorithms.J. Fu, A. Kumar, M. Soh, и S. Levine. ICML, том 97 из Proceedings of Machine Learning Research, стр. 2021-2030. PMLR, (2019)Conservative Data Sharing for Multi-Task Offline Reinforcement Learning.T. Yu, A. Kumar, Y. Chebotar, K. Hausman, S. Levine, и C. Finn. NeurIPS, стр. 11501-11516. (2021)COMBO: Conservative Offline Model-Based Policy Optimization.T. Yu, A. Kumar, R. Rafailov, A. Rajeswaran, S. Levine, и C. Finn. NeurIPS, стр. 28954-28967. (2021)

Что такое BibSonomy?: С чего начать; Кнопки для браузера; Помощь
Разработчикам: Обзор; API-документация

Контакт и защита личных данных: о нас; Cookies; Сообщить о проблеме; BibSonomy Вики

Интеграция: PUMA; Расширение для TYPO3; Плагин для; Клиент Java REST; Поддерживаемые источники; далее

О BibSonomy: Команда; Блог; Список рассылки
Социальные сети: Наш Twitter