[논문리뷰] KVarN: Variance-Normalized KV-Cache Quantization Mitigates Error Accumulation in Reasoning Tasks본 논문은 test-time scaling 환경에서 발생하는 KV-Cache 양자화의 오류 누적 문제를 해결하는 데 집중합니다. 기존의 양자화 방식은 주로 고정된 긴 컨텍스트를 다루는 prefill 설정에서 평가되었으나, 실제 디코딩 과정에서는 토큰 생성마다 오류가 반복적으로 누적되어 추론 품질이 급격히 저하됩니다 .#Review#KV-Cache Quantization#Variance Normalization#Error Accumulation#Reasoning Tasks#Hadamard Rotation#Dual-Scaling2026년 6월 2일댓글 수 로딩 중