#MUSA

1개의 포스트

[sglang] SGLang에서 torch.compile을 활용한 Wan 모델 추론 가속화

torch.compile을 도입하여 MUSA 및 CUDA 환경에서 Wan 모델의 추론 성능을 최대 1.09배 향상시킨 최적화 사례를 분석합니다.

#SGLang #torch.compile #MUSA #CUDA #Optimization

2026년 5월 17일