Autor der Publikation

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Retraining-Based Iterative Weight Quantization for Deep Neural Networks., und . CoRR, (2018)DeepTwist: Learning Model Compression via Occasional Weight Distortion., , und . CoRR, (2018)Rethinking Channel Dimensions to Isolate Outliers for Low-bit Weight Quantization of Large Language Models., , , , , und . CoRR, (2023)No Token Left Behind: Reliable KV Cache Compression via Importance-Aware Mixed Precision Quantization., , , , , , , und . CoRR, (2024)BiQGEMM: matrix multiplication with lookup table for binary-coding-based quantized DNNs., , , , , und . SC, Seite 95. IEEE/ACM, (2020)Encoding Weights of Irregular Sparsity for Fixed-to-Fixed Model Compression., , , , und . ICLR, OpenReview.net, (2022)Learning Low-Rank Approximation for CNNs., , , und . CoRR, (2019)Sequential Encryption of Sparse Neural Networks Toward Optimum Representation of Irregular Sparsity., , , , , , und . CoRR, (2021)Structured Compression by Weight Encryption for Unstructured Pruning and Quantization., , , , , und . CVPR, Seite 1906-1915. Computer Vision Foundation / IEEE, (2020)Extremely Low Bit Transformer Quantization for On-Device Neural Machine Translation., , , , , , , und . EMNLP (Findings), Volume EMNLP 2020 von Findings of ACL, Seite 4812-4826. Association for Computational Linguistics, (2020)