From post

копировать удалить добавить публикацию в буфер
Запись сообщества
посмотреть историю данной записи
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Removable and/or Repeated Units Emerge in Overparametrized Deep Neural Networks.

S. Casper, X. Boix, V. D'Amario, L. Guo, M. Schrimpf, K. Vinken, и G. Kreiman. CoRR, (2019)

Please choose a person to relate this publication to

To differ between persons with the same name, the academic degree and the title of an important publication will be displayed.

Wilhelm Casper

Rudolf Casper

Johannes Casper

Birge Casper

Wolfgang Casper

Другие публикации лиц с тем же именем

Frivolous Units: Wider Networks Are Not Really That Wide.S. Casper, X. Boix, V. D'Amario, L. Guo, M. Schrimpf, K. Vinken, и G. Kreiman. AAAI, стр. 6921-6929. AAAI Press, (2021)Benchmarking Interpretability Tools for Deep Neural Networks.S. Casper, Y. Li, J. Li, T. Bu, K. Zhang, и D. Hadfield-Menell. CoRR, (2023)Robust Feature-Level Adversaries are Interpretability Tools.S. Casper, M. Nadeau, D. Hadfield-Menell, и G. Kreiman. NeurIPS, (2022)Open Problems in Technical AI Governance.A. Reuel, B. Bucknall, S. Casper, T. Fist, L. Soder, O. Aarne, L. Hammond, L. Ibrahim, A. Chan, P. Wills и 21 other автор(ы). CoRR, (2024)White-Box Adversarial Policies in Deep Reinforcement Learning.S. Casper, D. Hadfield-Menell, и G. Kreiman. CoRR, (2022)Open Problems and Fundamental Limitations of Reinforcement Learning from Human Feedback.S. Casper, X. Davies, C. Shi, T. Gilbert, J. Scheurer, J. Rando, R. Freedman, T. Korbak, D. Lindner, P. Freire и 22 other автор(ы). Trans. Mach. Learn. Res., (2023)Rethinking Machine Unlearning for Large Language Models.S. Liu, Y. Yao, J. Jia, S. Casper, N. Baracaldo, P. Hase, X. Xu, Y. Yao, H. Li, K. Varshney и 3 other автор(ы). CoRR, (2024)Targeted Latent Adversarial Training Improves Robustness to Persistent Harmful Behaviors in LLMs.A. Sheshadri, A. Ewart, P. Guo, A. Lynch, C. Wu, V. Hebbar, H. Sleight, A. Stickland, E. Perez, D. Hadfield-Menell и 1 other автор(ы). CoRR, (2024)Defending Against Unforeseen Failure Modes with Latent Adversarial Training.S. Casper, L. Schulze, O. Patel, и D. Hadfield-Menell. CoRR, (2024)Cognitive Dissonance: Why Do Language Model Outputs Disagree with Internal Representations of Truthfulness?K. Liu, S. Casper, D. Hadfield-Menell, и J. Andreas. EMNLP, стр. 4791-4797. Association for Computational Linguistics, (2023)

Что такое BibSonomy?: С чего начать; Кнопки для браузера; Помощь
Разработчикам: Обзор; API-документация

Контакт и защита личных данных: о нас; Cookies; Сообщить о проблеме; BibSonomy Вики

Интеграция: PUMA; Расширение для TYPO3; Плагин для; Клиент Java REST; Поддерживаемые источники; далее

О BibSonomy: Команда; Блог; Список рассылки
Социальные сети: Наш Twitter