Autor der Publikation

3D Coded SUMMA: Communication-Efficient and Robust Parallel Matrix Multiplication.

, , , , , , , und . Euro-Par, Volume 12247 von Lecture Notes in Computer Science, Seite 392-407. Springer, (2020)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Concepts for OpenMP Target Offload Resilience., , und . IWOMP, Volume 11718 von Lecture Notes in Computer Science, Seite 78-93. Springer, (2019)A Comprehensive Informative Metric for Summarizing HPC System Status., , und . LDAV, Seite 102-103. IEEE, (2018)Epidemic failure detection and consensus for extreme parallelism., , , und . Int. J. High Perform. Comput. Appl., 32 (5): 729-743 (2018)Science Use Case Design Patterns for Autonomous Experiments., und . EuroPLoP, Seite 26:1-26:14. ACM, (2023)Big Data Meets HPC Log Analytics: Scalable Approach to Understanding Systems at Extreme Scale., , , und . CLUSTER, Seite 758-765. IEEE Computer Society, (2017)Power-Capping Aware Checkpointing: On the Interplay Among Power-Capping, Temperature, Reliability, Performance, and Energy., , , , , , und . DSN, Seite 311-322. IEEE Computer Society, (2016)Machine Learning Models for GPU Error Prediction in a Large Scale HPC System., , , , , , und . DSN, Seite 95-106. IEEE Computer Society, (2018)Job-Site Level Fault Tolerance for Cluster and Grid environments., , , , , , und . CLUSTER, Seite 1-9. IEEE Computer Society, (2005)Scalable and Fault Tolerant Failure Detection and Consensus., , , und . EuroMPI, Seite 13:1-13:9. ACM, (2015)Symmetric Active/Active Replication for Dependent Services., , , und . ARES, Seite 260-267. IEEE Computer Society, (2008)