[triton] GSan AxisInfo 기반 Shadow Update 중복 제거로 2~10배 성능 향상Triton의 Global Sanitizer에서 AxisInfo의 contiguity 속성을 활용하여 중복 shadow update를 제거하고, FP16 matmul에서 최대 10배 속도 향상을 달성한 PR을 분석합니다.#Triton#GPU#Sanitizer#Optimization#MLIR2026년 3월 27일댓글 수 로딩 중
[triton] AMD 백엔드에 Concurrency Sanitizer(ConSan) 지원 추가AMD GPU에서 GPU 동시성 버그를 감지하는 ConSan을 지원하기 위해 MBarrierOpInterface, 타겟 훅, 캡처 카운트 추정 등을 구현한 사례를 분석합니다.#Triton#AMD#GPU#ConSan#Sanitizer#Concurrency2026년 3월 26일댓글 수 로딩 중
[triton] Global Sanitizer에 TMA 및 cp.async 연산 부분 지원 추가Triton의 Global Sanitizer에 tensor descriptor 디코딩과 TMA/cp.async 연산의 메모리 접근 추적 기능을 추가한 PR 분석.#Triton#GSan#Sanitizer#TMA#AsyncCopy#Debugging2026년 3월 20일댓글 수 로딩 중
[triton] Concurrency Sanitizer를 Vendor Target Hooks로 리팩터링Triton의 Concurrency Sanitizer를 벤더 독립적인 인터페이스로 리팩터링하여 NVIDIA 외 다른 GPU 벤더도 지원할 수 있게 한 PR 분석.#Triton#ConSan#Sanitizer#Refactoring#VendorHooks#Architecture2026년 3월 9일댓글 수 로딩 중
[triton] FpSan - Floating Point Sanitizer 도입GPU 커널의 부동소수점 연산 오류를 런타임에 감지하는 FpSan(Floating Point Sanitizer)을 Triton에 도입한 PR을 분석합니다. MLIR 패스를 통해 FP 연산을 integer payload 방식으로 rewrite합니다.#Triton#GPU Compiler#Floating Point#Sanitizer#MLIR2026년 2월 6일댓글 수 로딩 중
[triton] Gluon TMA Op Verifier 강화 및 Illegal Instruction Sanitize 모드 추가Triton Gluon의 TMA 연산 verifier를 강화하고, descriptor와 tensor 간의 element 수 일치 검증, 그리고 illegal instruction sanitize 모드를 추가한 PR 분석.#Triton#Gluon#TMA#Verifier#Sanitizer#MLIR2026년 1월 7일댓글 수 로딩 중
[Triton] Concurrency Sanitizer에 TMA Store 검증 추가Triton의 동시성 검사기(CONSAN)가 TMA Store 연산의 메모리 접근도 추적하여 데이터 레이스를 감지#Triton#Sanitizer#TMA#Concurrency#NVIDIA2025년 11월 10일댓글 수 로딩 중
[triton] ConSan: 상태 변경 시 커널 재컴파일을 보장하여 JIT 캐시 무효화Concurrency Sanitizer 상태를 컴파일 옵션에 포함시켜 활성화/비활성화 시 커널이 자동으로 재컴파일되도록 하는 변경 분석.#Triton#ConSan#JIT#Cache#Sanitizer#Debugging2025년 10월 1일댓글 수 로딩 중