Autor der Publikation

Spartan: A Sparsity-Adaptive Framework to Accelerate Deep Neural Network Training on GPUs.

, , , , , , , , und . IEEE Trans. Parallel Distributed Syst., 32 (10): 2448-2463 (2021)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Data Transfer Optimizations for Host-CPU and Accelerators in AXI4MLIR., , , , und . CoRR, (2024)VCSR: An Efficient GPU Memory-Aware Sparse Format., , , und . IEEE Trans. Parallel Distributed Syst., 33 (10): 3977-3989 (2022)From High-Level Frameworks to custom Silicon with SODA., , , , , , , , , und 3 andere Autor(en). HCS, Seite 1-13. IEEE, (2022)AXI4MLIR: User-Driven Automatic Host Code Generation for Custom AXI-Based Accelerators., , , , , , , , und . CGO, Seite 143-157. IEEE, (2024)ML-CGRA: An Integrated Compilation Framework to Enable Efficient Machine Learning Acceleration on CGRAs., , , , , , und . DAC, Seite 1-6. IEEE, (2023)AXI4MLIR: User-Driven Automatic Host Code Generation for Custom AXI-Based Accelerators., , , , , , , , und . CoRR, (2023)An MLIR-based Compiler Flow for System-Level Design and Hardware Acceleration., , , , , , , , und . ICCAD, Seite 6:1-6:9. ACM, (2022)Towards Automatic and Agile AI/ML Accelerator Design with End-to-End Synthesis., , , , , , , , , und 2 andere Autor(en). ASAP, Seite 218-225. IEEE, (2021)Performance Evaluation and Improvement of Real-Time Computer Vision Applications for Edge Computing Devices., , und . ICPE (Companion), Seite 139-144. ACM, (2021)DRIPS: Dynamic Rebalancing of Pipelined Streaming Applications on CGRAs., , , , , , , und . HPCA, Seite 304-316. IEEE, (2022)