#Qwen2 MoE

1개의 포스트

[sglang] AMD GPU 최적화: Triton 커널 퓨전을 통한 Qwen2 MoE 공유 전문가 게이팅 성능 향상

AMD GPU에서 Qwen2 MoE 모델의 공유 전문가 게이팅 연산을 Triton 커널로 융합하여 성능을 개선한 PR 분석

#AMD #Triton #Triton Kernel Fusion #Qwen2 MoE #Performance Optimization #SGLang

2026년 6월 16일