[triton] Global Sanitizer에 TMA 및 cp.async 연산 부분 지원 추가Triton의 Global Sanitizer에 tensor descriptor 디코딩과 TMA/cp.async 연산의 메모리 접근 추적 기능을 추가한 PR 분석.#Triton#GSan#Sanitizer#TMA#AsyncCopy#Debugging2026년 3월 20일댓글 수 로딩 중
[triton] Async TMA Lowering에서 Cluster Barrier 로직 수정Triton의 TMA 비동기 복사에서 cluster barrier 사용 조건과 cross-CTA mbarrier init 동기화를 수정한 PR 분석.#Triton#NVIDIA#TMA#ClusterBarrier#MultiCTA#BugFix2026년 2월 19일댓글 수 로딩 중
[triton] NVIDIA TMA im2col 모드 Gluon 튜토리얼 - Convolution 커널 구현Triton Gluon을 사용하여 NVIDIA Blackwell GPU의 TMA im2col 모드로 Convolution 커널을 구현하는 튜토리얼 PR을 분석합니다.#Triton#NVIDIA#TMA#Convolution#Gluon2026년 2월 16일댓글 수 로딩 중
[Triton] TMA im2col 모드 — Gluon API 구현TMA im2col 시리즈의 Gluon DSL API 구현으로, Python에서 im2col 모드 TMA 복사를 직접 사용할 수 있게 한다#Triton#NVIDIA#TMA#im2col#Gluon#Convolution2026년 2월 9일댓글 수 로딩 중
[Triton] TMA im2col 모드 — LLVM Lowering 구현TMA im2col 시리즈의 다섯 번째 PR로, im2col descriptor 생성과 TMA 복사의 LLVM IR lowering을 구현한다#Triton#NVIDIA#TMA#im2col#LLVM#Compiler2026년 2월 6일댓글 수 로딩 중
[triton] NVIDIA TMA im2col 모드 드라이버 지원NVIDIA TMA의 im2col 모드를 위한 Python 드라이버 레벨 지원을 추가한 PR을 분석합니다. cuTensorMapEncodeIm2col API 바인딩과 descriptor 생성 로직을 살펴봅니다.#Triton#NVIDIA#TMA#Im2col#Driver2026년 1월 28일댓글 수 로딩 중
[Triton] TMA im2col 모드 — tma load op 수정NVIDIA TMA im2col 모드 시리즈의 세 번째 PR로, tma load op의 타입 매칭과 offset 처리를 수정한다#Triton#NVIDIA#TMA#im2col#Convolution2026년 1월 26일댓글 수 로딩 중
[triton] NVIDIA TMA im2col 모드 Tensor Descriptor 지원NVIDIA TMA의 im2col 모드를 Triton의 tensor descriptor 시스템에 통합한 PR을 분석합니다. TensorDescInterface 도입과 TensorDescIm2ColType 추가를 통해 convolution-friendly 메모리 접근 패턴을 지원합니다.#Triton#NVIDIA#TMA#Im2col#Convolution#MLIR2026년 1월 26일댓글 수 로딩 중
[triton] Gluon TMA Op Verifier 강화 및 Illegal Instruction Sanitize 모드 추가Triton Gluon의 TMA 연산 verifier를 강화하고, descriptor와 tensor 간의 element 수 일치 검증, 그리고 illegal instruction sanitize 모드를 추가한 PR 분석.#Triton#Gluon#TMA#Verifier#Sanitizer#MLIR2026년 1월 7일댓글 수 로딩 중
[triton] AutoWS에서 TMA와 non-TMA 로드 혼합 시 self-latency 및 MMA 처리 수정Warp specialization에서 TMA와 일반 로드가 혼합될 때 MMA의 self-latency를 올바르게 설정하고 warp-specialized MMA를 lowerMMA에서 처리하도록 수정한 PR을 분석합니다.#Triton#NVIDIA#AutoWS#TMA#Pipeline2026년 1월 7일댓글 수 로딩 중
[Triton] ConSan에서 barrier 다중 도착 시 false positive deadlock 감지 수정barrier_expect를 arrive로 모델링하여 여러 TMA copy가 같은 barrier를 공유할 때 발생하는 오탐 deadlock 해결#Triton#ConSan#Concurrency Sanitizer#Bug Fix#TMA2025년 12월 19일댓글 수 로딩 중
[Triton] Concurrency Sanitizer에 TMA Store 검증 추가Triton의 동시성 검사기(CONSAN)가 TMA Store 연산의 메모리 접근도 추적하여 데이터 레이스를 감지#Triton#Sanitizer#TMA#Concurrency#NVIDIA2025년 11월 10일댓글 수 로딩 중