LLMCBench: Benchmarking Large Language Model Compression for Efficient Deployment

Published in NeurIPS D&B(Spotlight), 2024

Jinyang Guo, Ge Yang, Changyi He, Jianyu Wu, Yifu Ding, Aishan Liu, Haotong Qin, Pengliang Ji, Xianglong Liu