#Post-training Quantization

1개의 포스트

[논문리뷰] Optimal Brain Restoration for Joint Quantization and Sparsification of LLMs

본 논문은 대규모 언어 모델(LLMs)의 효율적인 배포를 위해 양자화(Quantization) 와 희소화(Sparsification) 를 동시에 적용하는 새로운 압축 방법을 제안합니다.

#Review #LLM Compression #Quantization #Sparsification #Post-training Quantization #Hessian-based Optimization #Error Compensation #Low-bit LLMs

2025년 9월 17일