Autor der Publikation

Improving Communication Performance and Scalability of Native Applications on Intel Xeon Phi Coprocessor Clusters.

, , , , , , , , , , und . IPDPS, Seite 1083-1092. IEEE Computer Society, (2014)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Cache-oblivious matrix algorithms in the age of multicores and many cores., und . Concurr. Comput. Pract. Exp., 27 (9): 2215-2234 (2015)PolyDL: Polyhedral Optimizations for Creation of High Performance DL primitives., , , , , und . CoRR, (2020)High accuracy molecular dynamics simulation of fluids at interfaces, , , , , , , , , und 1 andere Autor(en). Seite 122-123. LRZ, Garching, (2016)FPGA-based AI Smart NICs for Scalable Distributed AI Training Systems., , , , und . CoRR, (2022)Petascale Local Time Stepping for the ADER-DG Finite Element Method., , und . IPDPS, Seite 854-863. IEEE Computer Society, (2016)ISA mapper: a compute and hardware agnostic deep learning compiler., , , , , und . CF, Seite 164-173. ACM, (2019)Next-Generation Local Time Stepping for the ADER-DG Finite Element Method., und . IPDPS, Seite 402-413. IEEE, (2022)DistGNN: scalable distributed training for large-scale graph neural networks., , , , , , , , und . SC, Seite 76. ACM, (2021)FPGA-Based AI Smart NICs for Scalable Distributed AI Training Systems., , , , , und . IEEE Comput. Archit. Lett., 21 (2): 49-52 (2022)Full correlation matrix analysis of fMRI data on Intel® Xeon Phi™ coprocessors, , , , , , , , und . SC'15: Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis, Seite 1--12. IEEE, (2015)