[Triton] 커널 끝에 cross-CTA barrier 추가 — 클러스터 메모리 정합성 보장미처리 읽기/쓰기가 있는 커널 종료 시 클러스터 수준 barrier를 삽입하여 CTA 간 메모리 정합성을 보장한다#Triton#NVIDIA#Cluster#Memory Barrier#Correctness2026년 2월 10일댓글 수 로딩 중
[triton] 클러스터 환경을 위한 Membar 패스 확장Triton의 membar 분석을 클러스터 환경에 맞게 확장하여, AllocationSlice에 buffer ID를 추가하고 slice/op 레벨의 세분화된 filter를 지원하는 PR을 분석합니다.#Triton#Memory Barrier#Cluster#Shared Memory#Static Analysis2026년 2월 9일댓글 수 로딩 중