Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

HyperDrive: exploring hyperparameters with POP scheduling., , , , und . Middleware, Seite 1-13. ACM, (2017)Performance Modeling and Scalability Optimization of Distributed Deep Learning Systems., , , und . KDD, Seite 1355-1364. ACM, (2015)FP6-LLM: Efficiently Serving Large Language Models Through FP6-Centric Algorithm-System Co-Design., , , , , , , , , und 3 andere Autor(en). CoRR, (2024)BLOOM: A 176B-Parameter Open-Access Multilingual Language Model., , , , , , , , , und 39 andere Autor(en). CoRR, (2022)DeepSpeed-Chat: Easy, Fast and Affordable RLHF Training of ChatGPT-like Models at All Scales., , , , , , , , , und 9 andere Autor(en). CoRR, (2023)Ditto - A System for Opportunistic Caching in Multi-hop Wireless Mesh Networks, , , , und . \ ACM Mobicom, (2008)ZeRO: Memory Optimization Towards Training A Trillion Parameter Models., , , und . CoRR, (2019)SHARP: An Adaptable, Energy-Efficient Accelerator for Recurrent Neural Networks., , , , , und . ACM Trans. Embed. Comput. Syst., 22 (2): 30:1-30:23 (März 2023)A Novel Tensor-Expert Hybrid Parallelism Approach to Scale Mixture-of-Experts Training., , , , , und . CoRR, (2023)Found in the Middle: How Language Models Use Long Contexts Better via Plug-and-Play Positional Encoding., , , , , , , und . CoRR, (2024)