Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Do the Rewards Justify the Means? Measuring Trade-Offs Between Rewards and Ethical Behavior in the MACHIAVELLI Benchmark., , , , , , , , , und . CoRR, (2023)Papaya: Federated Learning, but Fully Decentralized., , , und . CoRR, (2023)PixMix: Dreamlike Pictures Comprehensively Improve Safety Measures., , , , , , und . CoRR, (2021)Forecasting Future World Events With Neural Networks., , , , , , , , , und . NeurIPS, (2022)The WMDP Benchmark: Measuring and Reducing Malicious Use With Unlearning., , , , , , , , , und 44 andere Autor(en). CoRR, (2024)Representation Engineering: A Top-Down Approach to AI Transparency., , , , , , , , , und 11 andere Autor(en). CoRR, (2023)Measuring Massive Multitask Language Understanding., , , , , , und . CoRR, (2020)Universal and Transferable Adversarial Attacks on Aligned Language Models., , , und . CoRR, (2023)Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models., , , , , , , , , und 42 andere Autor(en). CoRR, (2022)How Would The Viewer Feel? Estimating Wellbeing From Video Scenarios., , , , , , , , und . NeurIPS, (2022)