[SGLang] Session-Aware Cache: 사용자별 KV 캐시 파티셔닝SGLang의 Session-Aware Cache를 분석한다. 세션 단위로 KV 캐시를 파티셔닝하여 멀티턴 대화에서 캐시 재활용률을 높이는 전략을 코드와 함께 살펴본다.#sglang#Session Cache#Multi-turn#Cache Partitioning2026년 4월 11일댓글 수 로딩 중