From post

копировать удалить добавить публикацию в буфер
Запись сообщества
посмотреть историю данной записи
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

MiniHack the Planet: A Sandbox for Open-Ended Reinforcement Learning Research.

M. Samvelyan, R. Kirk, V. Kurin, J. Parker-Holder, M. Jiang, E. Hambro, F. Petroni, H. Küttler, E. Grefenstette, и T. Rocktäschel. NeurIPS Datasets and Benchmarks, (2021)

Please choose a person to relate this publication to

To differ between persons with the same name, the academic degree and the title of an important publication will be displayed.

Friederike Erichsen-Wendt

Claus Erichsen

Kay Erichsen

Curt Erich

Knut Erichsen

Другие публикации лиц с тем же именем

Teaching Large Language Models to Reason with Reinforcement Learning.A. Havrilla, Y. Du, S. Raparthy, C. Nalmpantis, J. Dwivedi-Yu, M. Zhuravinskyi, E. Hambro, S. Sukhbaatar, и R. Raileanu. CoRR, (2024)Understanding the Effects of RLHF on LLM Generalisation and Diversity.R. Kirk, I. Mediratta, C. Nalmpantis, J. Luketina, E. Hambro, E. Grefenstette, и R. Raileanu. CoRR, (2023)LLaMA: Open and Efficient Foundation Language Models.H. Touvron, T. Lavril, G. Izacard, X. Martinet, M. Lachaux, T. Lacroix, B. Rozière, N. Goyal, E. Hambro, F. Azhar и 4 other автор(ы). CoRR, (2023)Generalization to New Sequential Decision Making Tasks with In-Context Learning.S. Raparthy, E. Hambro, R. Kirk, M. Henaff, и R. Raileanu. ICML, OpenReview.net, (2024)Dungeons and Data: A Large-Scale NetHack Dataset.E. Hambro, R. Raileanu, D. Rothermel, V. Mella, T. Rocktäschel, H. Küttler, и N. Murray. NeurIPS, (2022)Know When To Stop: A Study of Semantic Drift in Text Generation.A. Spataru, E. Hambro, E. Voita, и N. Cancedda. NAACL-HLT, стр. 3656-3671. Association for Computational Linguistics, (2024)LLaMA: Open and Efficient Foundation Language ModelsH. Touvron, T. Lavril, G. Izacard, X. Martinet, M. Lachaux, T. Lacroix, B. Rozière, N. Goyal, E. Hambro, F. Azhar и 4 other автор(ы). CoRR, (2023)Llama: Open and efficient foundation language modelsH. Touvron, T. Lavril, G. Izacard, X. Martinet, M. Lachaux, T. Lacroix, B. Rozière, N. Goyal, E. Hambro, F. Azhar и 1 other автор(ы). arXiv preprint arXiv:2302.13971, (2023)Understanding the Effects of RLHF on LLM Generalisation and Diversity.R. Kirk, I. Mediratta, C. Nalmpantis, J. Luketina, E. Hambro, E. Grefenstette, и R. Raileanu. ICLR, OpenReview.net, (2024)MiniHack the Planet: A Sandbox for Open-Ended Reinforcement Learning Research.M. Samvelyan, R. Kirk, V. Kurin, J. Parker-Holder, M. Jiang, E. Hambro, F. Petroni, H. Küttler, E. Grefenstette, и T. Rocktäschel. NeurIPS Datasets and Benchmarks, (2021)

Что такое BibSonomy?: С чего начать; Кнопки для браузера; Помощь
Разработчикам: Обзор; API-документация

Контакт и защита личных данных: о нас; Cookies; Сообщить о проблеме; BibSonomy Вики

Интеграция: PUMA; Расширение для TYPO3; Плагин для; Клиент Java REST; Поддерживаемые источники; далее

О BibSonomy: Команда; Блог; Список рассылки
Социальные сети: Наш Twitter