#Sparsification

3개의 포스트

[논문리뷰] SQ-format: A Unified Sparse-Quantized Hardware-friendly Data Format for LLMs

Minghui Yu이 arXiv에 게시한 'SQ-format: A Unified Sparse-Quantized Hardware-friendly Data Format for LLMs' 논문에 대한 자세한 리뷰입니다.

#Review #LLM Quantization #Sparsification #Hardware Acceleration #Mixed-Precision #Post-Training Quantization #Data Format #GPU Optimization #AI Accelerator

2025년 12월 7일

[논문리뷰] Optimal Brain Restoration for Joint Quantization and Sparsification of LLMs

Luca Benini이 arXiv에 게시한 'Optimal Brain Restoration for Joint Quantization and Sparsification of LLMs' 논문에 대한 자세한 리뷰입니다.

#Review #LLM Compression #Quantization #Sparsification #Post-training Quantization #Hessian-based Optimization #Error Compensation #Low-bit LLMs

2025년 9월 17일

[논문리뷰] CogVLA: Cognition-Aligned Vision-Language-Action Model via Instruction-Driven Routing & Sparsification

Liqiang Nie이 arXiv에 게시한 'CogVLA: Cognition-Aligned Vision-Language-Action Model via Instruction-Driven Routing & Sparsification' 논문에 대한 자세한 리뷰입니다.

#Review #Vision-Language-Action Model #Sparsification #Instruction-Driven Routing #Cognition-Aligned AI #Robotics #Computational Efficiency #Multimodal AI

2025년 8월 29일