Autor der Publikation

Evaluating performance and portability of high-level programming models: Julia, Python/Numba, and Kokkos on exascale nodes.

, , , , , , , , , und . IPDPS Workshops, Seite 373-382. IEEE, (2023)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Accelerating fluid-solid simulations (Lattice-Boltzmann & Immersed-Boundary) on heterogeneous architectures., , , , und . J. Comput. Sci., (2015)MPI+OpenMP Tasking Scalability for Multi-Morphology Simulations of the Human Brain., , , und . CoRR, (2020)A GPU-Based Implementation for Range Queries on Spaghettis Data Structure., , , , und . ICCSA (1), Volume 6782 von Lecture Notes in Computer Science, Seite 615-629. Springer, (2011)cuConv: A CUDA Implementation of Convolution for CNN Inference., , und . CoRR, (2021)cuConv: CUDA implementation of convolution for CNN inference., , und . Clust. Comput., 25 (2): 1459-1473 (2022)Leveraging the Performance of LBM-HPC for Large Sizes on GPUs Using Ghost Cells.. ICA3PP, Volume 10048 von Lecture Notes in Computer Science, Seite 417-430. Springer, (2016)SparseLU, A Novel Algorithm and Math Library for Sparse LU Factorization., , und . IA3@SC, Seite 25-31. IEEE, (2022)Moment Representation of Regularized Lattice Boltzmann Methods on NVIDIA and AMD GPUs., , , und . SC Workshops, Seite 1697-1704. ACM, (2023)Heuristics for ROSA's LTS Searching., , , , und . IWANN (2), Volume 10306 von Lecture Notes in Computer Science, Seite 427-437. Springer, (2017)Variable Batched DGEMM., , , , , , und . PDP, Seite 363-367. IEEE Computer Society, (2018)