Autor der Publikation

BPipe: Memory-Balanced Pipeline Parallelism for Training Large Language Models.

, , , und . ICML, Volume 202 von Proceedings of Machine Learning Research, Seite 16639-16653. PMLR, (2023)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Parallax: Sparsity-aware Data Parallel Training of Deep Neural Networks., , , , , , , , und . EuroSys, Seite 43:1-43:15. ACM, (2019)Nimble: Lightweight and Parallel GPU Task Scheduling for Deep Learning., , , und . NeurIPS, (2020)Improving the expressiveness of deep learning frameworks with recursion., , , , und . EuroSys, Seite 19:1-19:13. ACM, (2018)Automating System Configuration of Distributed Machine Learning., , , , , , , , , und 2 andere Autor(en). ICDCS, Seite 2057-2067. IEEE, (2019)BPipe: Memory-Balanced Pipeline Parallelism for Training Large Language Models., , , und . ICML, Volume 202 von Proceedings of Machine Learning Research, Seite 16639-16653. PMLR, (2023)A Tensor Compiler for Unified Machine Learning Prediction Serving., , , , , , und . OSDI, Seite 899-917. USENIX Association, (2020)JANUS: Fast and Flexible Deep Learning via Symbolic Graph Execution of Imperative Programs., , , , , und . NSDI, Seite 453-468. USENIX Association, (2019)Orca: A Distributed Serving System for Transformer-Based Generative Models., , , , und . OSDI, Seite 521-538. USENIX Association, (2022)Terra: Imperative-Symbolic Co-Execution of Imperative Deep Learning Programs., , , , , , und . NeurIPS, Seite 1468-1480. (2021)