[논문리뷰] ReFreeKV: Towards Threshold-Free KV Cache Compression본 논문은 기존의 KV cache pruning 연구들이 특정 데이터셋이나 도메인에 종속된 Budget Threshold 설정에 지나치게 의존하여, 실제 환경의 가변적인 입력 처리에 한계가 있다는 점을 지적한다.#Review#KV Cache Compression#Threshold-Free#Large Language Models#Attention Sparsity#Inference Efficiency#Dynamic Budgeting2026년 6월 29일댓글 수 로딩 중