From post

копировать удалить добавить публикацию в буфер
Запись сообщества
посмотреть историю данной записи
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

BeaverTails: Towards Improved Safety Alignment of LLM via a Human-Preference Dataset.

J. Ji, M. Liu, J. Dai, X. Pan, C. Zhang, C. Bian, B. Zhang, R. Sun, Y. Wang, и Y. Yang. CoRR, (2023)

Please choose a person to relate this publication to

To differ between persons with the same name, the academic degree and the title of an important publication will be displayed.

Xiaoqing Pan

Petra Pan

Alexey Pan

Weiqing Pan

Yaling Pan

Другие публикации лиц с тем же именем

Rethinking Information Structures in RLHF: Reward Generalization from a Graph Theory Perspective.T. Qiu, F. Zeng, J. Ji, D. Yan, K. Wang, J. Zhou, H. Yang, J. Dai, X. Pan, и Y. Yang. CoRR, (2024)MATE: Benchmarking Multi-Agent Reinforcement Learning in Distributed Target Coverage Control.X. Pan, M. Liu, F. Zhong, Y. Yang, S. Zhu, и Y. Wang. NeurIPS, (2022)Aligner: Achieving Efficient Alignment through Weak-to-Strong Correction.J. Ji, B. Chen, H. Lou, D. Hong, B. Zhang, X. Pan, J. Dai, и Y. Yang. CoRR, (2024)Red Teaming Game: A Game-Theoretic Framework for Red Teaming Language Models.C. Ma, Z. Yang, M. Gao, H. Ci, J. Gao, X. Pan, и Y. Yang. CoRR, (2023)OmniSafe: An Infrastructure for Accelerating Safe Reinforcement Learning Research.J. Ji, J. Zhou, B. Zhang, J. Dai, X. Pan, R. Sun, W. Huang, Y. Geng, M. Liu, и Y. Yang. CoRR, (2023)Proactive Multi-Camera Collaboration for 3D Human Pose Estimation.H. Ci, M. Liu, X. Pan, F. Zhong, и Y. Wang. ICLR, OpenReview.net, (2023)AI Alignment: A Comprehensive Survey.J. Ji, T. Qiu, B. Chen, B. Zhang, H. Lou, K. Wang, Y. Duan, Z. He, J. Zhou, Z. Zhang и 15 other автор(ы). CoRR, (2023)BeaverTails: Towards Improved Safety Alignment of LLM via a Human-Preference Dataset.J. Ji, M. Liu, J. Dai, X. Pan, C. Zhang, C. Bian, B. Zhang, R. Sun, Y. Wang, и Y. Yang. CoRR, (2023)Safety-Gymnasium: A Unified Safe Reinforcement Learning Benchmark.J. Ji, B. Zhang, J. Zhou, X. Pan, W. Huang, R. Sun, Y. Geng, Y. Zhong, J. Dai, и Y. Yang. CoRR, (2023)TorchOpt: An Efficient Library for Differentiable Optimization.J. Ren, X. Feng, B. Liu, X. Pan, Y. Fu, L. Mai, и Y. Yang. CoRR, (2022)

Что такое BibSonomy?: С чего начать; Кнопки для браузера; Помощь
Разработчикам: Обзор; API-документация

Контакт и защита личных данных: о нас; Cookies; Сообщить о проблеме; BibSonomy Вики

Интеграция: PUMA; Расширение для TYPO3; Плагин для; Клиент Java REST; Поддерживаемые источники; далее

О BibSonomy: Команда; Блог; Список рассылки
Социальные сети: Наш Twitter