본문으로 건너뛰기

secrett2633's blog

카테고리

Python

PEP (650)

AI/ML

Review (4880)

OpenSource

PR Analysis (1030)
vLLM (71)
SGLang (130)
llm-compressor (45)

Python

PEP (650)

AI/ML

Review (4880)

OpenSource

PR Analysis (1030)
vLLM (71)
SGLang (130)
llm-compressor (45)

홈
#Reduce

#Reduce

2개의 포스트

[triton] Reduce 커널에 Unpadded Batch Size 핸들링 추가

Triton Kernels의 reduce 커널에 unpadded batch size를 지원하여 패딩된 배치에서 불필요한 연산을 건너뛰도록 개선한 PR 분석.

#Triton #TritonKernels #Reduce #Padding #BatchSize #Performance

2026년 1월 30일댓글 수 로딩 중

[triton] Expert Parallelism 기본 구현과 Reduce 커널 추가

Triton Kernels 라이브러리에 Expert Parallelism을 위한 기본 구현과 독립적인 reduce 커널을 추가하여 MoE 워크로드의 분산 처리를 지원하는 PR 분석.

#Triton #ExpertParallelism #MoE #Reduce #Distributed #GPU

2025년 10월 16일댓글 수 로딩 중

AI Review Python PEP PR Analysis RSS GitHub

© 2026 secrett2633. All rights reserved.