[Triton] GFX1250 tensordesc index 수정
들어가며
Triton의 AMD gfx1250 백엔드에서 커널 launch 호출에 global_scratch 인자가 새로 추가되면서(commit ff4076270), 이후의 모든 인자 인덱스가 1만큼 밀려야 했다. 이 PR은 host-side TensorDescriptor 처리에서 해당 인덱스를 수정한다.
핵심 코드 분석
Before
kernel_metadata = base_args[7]
After
kernel_metadata = base_args[8]
global_scratch 인자가 인덱스 7에 삽입되었으므로, 기존 인덱스 7의 kernel_metadata는 인덱스 8로 이동했다.
왜 이게 좋은가
- 즉각 수정: 새 인자 추가로 인한 off-by-one 버그를 바로 수정하여 host TDM(Tensor Data Mover) 실패를 방지한다.
- 단순 명확: +1/-1의 최소 변경으로 문제를 정확히 해결한다.
정리
인자 순서 의존적인 코드에서 새 인자 추가 시 관련 인덱스를 모두 업데이트해야 한다는 기본적이지만 놓치기 쉬운 패턴의 수정이다.
참고 자료
이 글은 AI(Claude)의 도움을 받아 작성되었습니다. 코드 분석 내용은 실제 PR diff를 기반으로 합니다.
댓글