[논문리뷰] RoPE-Aware Bit Allocation for KV-Cache Quantization본 논문은 기존 KV-Cache 양자화 기법들이 Key를 단순한 평면 벡터(Flat Vector)로 취급하여 발생하는 정보 손실 문제를 해결하고자 합니다.#Review#KV-Cache Quantization#RoPE#Bit Allocation#LLM Inference#Long-Context#TurboQuant#Block-GTQ2026년 6월 24일댓글 수 로딩 중