[논문리뷰] ELDR: Expert-Locality-Aware Decode Routing for PD-Disaggregated MoE Serving본 논문은 PD-disaggregated MoE 서빙 환경에서 기존 라우팅 방식이 단순히 부하 분산(Load balancing)에만 집중하여 발생하는 비효율을 해결하고자 합니다.#Review#Mixture-of-Experts#PD-Disaggregated Serving#Expert Locality#Decode Routing#Prefix Caching#TPOT2026년 7월 1일댓글 수 로딩 중