[triton] AMD Async Load에 ROCDL Op 사용으로 전환AMD GPU의 async load 연산에서 LLVM intrinsic 문자열 기반 호출을 타입 안전한 ROCDL op으로 교체한 NFC(Non-Functional Change) PR 분석.#Triton#AMD#ROCDL#AsyncCopy#NFC#Refactoring2026년 2월 9일댓글 수 로딩 중
[Triton] AMD에 MemoryCounterWaitOp과 ROCDL lowering 추가하드웨어 메모리 카운터 대기를 추상화하는 MemoryCounterWaitOp을 도입하여 아키텍처별 waitcnt 인코딩을 통합 관리#Triton#AMD#ROCDL#Synchronization#ISA2025년 11월 10일댓글 수 로딩 중