[논문리뷰] dMoE: dLLMs with Learnable Block Experts본 논문은 MoE 기반 dLLM에서 블록 병렬 디코딩(block parallel decoding) 시 발생하는 과도한 전문가 활성화 문제를 해결하여 inference 효율성을 높이는 것을 목적으로 합니다.#Review#dLLM#Mixture-of-Experts#Parallel Decoding#Block-level Routing#Expert Compression#Memory-bound2026년 5월 31일댓글 수 로딩 중