#moe

5개의 포스트

[vLLM] Shared Experts: 공유 전문가 레이어 (DeepSeek-V2/V3)

vLLM의 공유 전문가(Shared Expert) 구현을 분석한다. DeepSeek-V2/V3의 공유 전문가와 라우팅 전문가를 동시에 실행하는 구조.

#vllm #moe #shared-experts #deepseek

2026년 4월 8일

[vLLM] MoE Oracle & Prepare/Finalize: 백엔드 선택과 분산 데이터 교환

vLLM MoE의 Oracle 시스템(백엔드 자동 선택)과 Prepare/Finalize 패턴(분산 데이터 교환)을 분석한다.

#vllm #moe #oracle #deepep #expert-parallelism

2026년 4월 7일

[vLLM] MoE 라우팅 전략: 7종 라우팅 알고리즘 분석

vLLM의 MoE 라우터 구현을 분석한다. FusedTopK, GroupedTopK, BiasRouter, CustomRouting, RoutingSimulator까지 7가지 라우팅 전략.

#vllm #moe #routing #deepseek #expert-selection

2026년 4월 7일

[vLLM] Expert Parallelism & EPLB: 전문가 병렬화와 부하 균형

vLLM의 Expert Parallelism 구현과 EPLB(Expert Parallelism Load Balancer)의 동적 전문가 재배치 메커니즘을 코드와 함께 분석한다.

#vllm #expert-parallelism #load-balancing #deepseek #moe

2026년 4월 7일

[vLLM] Fused MoE: 라우팅+전문가 연산 융합

vLLM의 Fused MoE 레이어가 라우터와 전문가 연산을 하나의 커널로 융합하여 MoE 모델을 효율적으로 서빙하는 구조를 분석한다.

#vllm #moe #fused-kernel #deepseek #mixtral

2026년 4월 7일