Autor der Publikation

Performance of random sampling for computing low-rank approximations of a dense matrix on GPUs.

, , , , , und . SC, Seite 60:1-60:11. ACM, (2015)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Towards Achieving Performance Portability Using Directives for Accelerators., , , , , , und . WACCPD@SC, Seite 13-24. IEEE Computer Society, (2016)Optimizing GPU Kernels for Irregular Batch Workloads: A Case Study for Cholesky Factorization., , , und . HPEC, Seite 1-7. IEEE, (2018)Scalability Issues in FFT Computation., , , und . PaCT, Volume 12942 von Lecture Notes in Computer Science, Seite 279-287. Springer, (2021)Efficient implementation of quantum materials simulations on distributed CPU-GPU systems., , , , , und . SC, Seite 10:1-10:12. ACM, (2015)Performance, Design, and Autotuning of Batched GEMM for GPUs., , , und . ISC, Volume 9697 von Lecture Notes in Computer Science, Seite 21-38. Springer, (2016)Towards Half-Precision Computation for Complex Matrices: A Case Study for Mixed Precision Solvers on GPUs., , und . ScalA@SC, Seite 17-24. IEEE, (2019)Tridiagonalization of a Symmetric Dense Matrix on a GPU Cluster., , , und . IPDPS Workshops, Seite 1070-1079. IEEE, (2013)The Impact of Multicore on Math Software., , , , , und . PARA, Volume 4699 von Lecture Notes in Computer Science, Seite 1-10. Springer, (2006)Autotuning GEMM Kernels for the Fermi GPU., , und . IEEE Trans. Parallel Distributed Syst., 23 (11): 2045-2057 (2012)Stability and Performance of Various Singular Value QR Implementations on Multicore CPU with a GPU., , und . ACM Trans. Math. Softw., 43 (2): 10:1-10:18 (2016)