[sglang] AMD GPU 최적화: Triton 커널 퓨전을 통한 Qwen2 MoE 공유 전문가 게이팅 성능 향상AMD GPU에서 Qwen2 MoE 모델의 공유 전문가 게이팅 연산을 Triton 커널로 융합하여 성능을 개선한 PR 분석#AMD#Triton#Triton Kernel Fusion#Qwen2 MoE#Performance Optimization#SGLang2026년 6월 16일댓글 수 로딩 중