#Ternary Weights

1개의 포스트

[논문리뷰] BitNet Distillation

본 논문은 기존의 풀-정밀도 LLM (예: Qwen )을 특정 다운스트림 태스크를 위해 1.58비트 정밀도 (삼진 가중치: {-1, 0, 1}) 로 미세 조정하여, 최소한의 계산 비용으로 풀-정밀도 모델에 필적하는 성능을 달성하는 것을 목표로 합니다.

#Review #Low-bit Quantization #LLM Compression #Knowledge Distillation #Ternary Weights #Inference Optimization #Memory Efficiency #SubLN #Continual Pre-training

2025년 10월 17일