Autor der Publikation

High-Performance Matrix-Matrix Multiplications of Very Small Matrices.

, , , , , , und . Euro-Par, Volume 9833 von Lecture Notes in Computer Science, Seite 659-671. Springer, (2016)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Abstract: A Novel Hybrid CPU-GPU Generalized Eigensolver for Electronic Structure Calculations Based on Fine Grained Memory Aware Tasks., , , , und . SC Companion, Seite 1338-1339. IEEE Computer Society, (2012)Harnessing GPU tensor cores for fast FP16 arithmetic to speed up mixed-precision iterative refinement solvers., , , und . SC, Seite 47:1-47:11. IEEE / ACM, (2018)Model-Driven One-Sided Factorizations on Multicore Accelerated Systems., , , , , und . Supercomput. Front. Innov., 1 (1): 85-115 (2014)Parallel reduction to condensed forms for symmetric eigenvalue problems using aggregated fine-grained and memory-aware kernels., , und . SC, Seite 8:1-8:11. ACM, (2011)Accelerating Numerical Dense Linear Algebra Calculations with GPUs., , , , , , und . Numerical Computations with GPUs, Springer, (2014)Leading Edge Hybrid Multi-GPU Algorithms for Generalized Eigenproblems in Electronic Structure Calculations., , , , , und . ISC, Volume 7905 von Lecture Notes in Computer Science, Seite 67-80. Springer, (2013)Heterogeneous Streaming., , , , , , , , , und 8 andere Autor(en). IPDPS Workshops, Seite 611-620. IEEE Computer Society, (2016)Novel HPC techniques to batch execution of many variable size BLAS computations on GPUs., , , und . ICS, Seite 5:1-5:10. ACM, (2017)Heterogenous Acceleration for Linear Algebra in Multi-coprocessor Environments., , , und . VECPAR, Volume 8969 von Lecture Notes in Computer Science, Seite 31-42. Springer, (2014)Performance Analysis of Parallel FFT on Large Multi-GPU Systems., , , , und . IPDPS Workshops, Seite 372-381. IEEE, (2022)