Autor der Publikation

Programming the LU Factorization for a Multicore System with Accelerators.

, , , und . VECPAR, Volume 7851 von Lecture Notes in Computer Science, Seite 28-35. Springer, (2012)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Implementation and Tuning of Batched Cholesky Factorization and Solve for NVIDIA GPUs., , , und . IEEE Trans. Parallel Distributed Syst., 27 (7): 2036-2048 (2016)Experiences in autotuning matrix multiplication for energy minimization on GPUs., , , , und . Concurr. Comput. Pract. Exp., 27 (17): 5096-5113 (2015)Accelerating Scientific Computations with Mixed Precision Algorithms, , , , , , , und . CoRR, (2008)Parallel Simulation of Superscalar Scheduling., , , , und . ICPP, Seite 121-130. IEEE Computer Society, (2014)An improved parallel singular value algorithm and its implementation for multicore hardware., , und . SC, Seite 90:1-90:12. ACM, (2013)Autotuning Techniques for Performance-Portable Point Set Registration in 3D., , , , , und . Supercomput. Front. Innov., 5 (4): 42-61 (2018)Design and Implementation of the PULSAR Programming System for Large Scale Computing., , , , und . Supercomput. Front. Innov., 4 (1): 4-26 (2017)Fast and Small Short Vector SIMD Matrix Multiplication Kernels for the Synergistic Processing Element of the CELL Processor., , und . ICCS (1), Volume 5101 von Lecture Notes in Computer Science, Seite 935-944. Springer, (2008)Introduction to Programming High Performance Applications on the CELL Broadband Engine., und . Hot Interconnects, Seite 11. IEEE Computer Society, (2007)Access-averse framework for computing low-rank matrix approximations., , , , und . IEEE BigData, Seite 70-77. IEEE Computer Society, (2014)