#LLM Quantization

2개의 포스트

[논문리뷰] RaBiT: Residual-Aware Binarization Training for Accurate and Efficient LLMs

arXiv에 게시된 'RaBiT: Residual-Aware Binarization Training for Accurate and Efficient LLMs' 논문에 대한 자세한 리뷰입니다.

2026년 2월 9일

[논문리뷰] SQ-format: A Unified Sparse-Quantized Hardware-friendly Data Format for LLMs

Minghui Yu이 arXiv에 게시한 'SQ-format: A Unified Sparse-Quantized Hardware-friendly Data Format for LLMs' 논문에 대한 자세한 리뷰입니다.

2025년 12월 8일