Artikel,

SLoB: Suboptimal Load Balancing Scheduling in Local Heterogeneous GPU Clusters for Large Language Model Inference.

, , , , , , und .
IEEE Trans. Comput. Soc. Syst., 11 (6): 7941-7951 (Dezember 2024)

Metadaten

Tags

Nutzer

  • @dblp

Kommentare und Rezensionen