[Triton] AMD TDM 연산에 multi-CTA 및 multicast 지원 추가CGALayout 기반으로 TDM load/store에 멀티캐스트 마스크를 자동 설정하여 cluster 간 데이터 공유 가능#Triton#AMD#TDM#Multi-CTA#Multicast2025년 11월 24일댓글 수 로딩 중
[Triton] AMD gfx1250 tt.LoadOp에 multicast 지원 추가cluster_load를 사용하여 여러 CTA에 동시 레지스터 로드를 수행하는 multicast 기능 구현#Triton#AMD#gfx1250#Multicast#Load2025년 11월 18일댓글 수 로딩 중
[Triton] gfx1250에서 async_copy multicast 지원AMD gfx1250 타겟의 async_copy_global_to_local에 cluster load 기반 multicast를 추가하여 CTA간 데이터 공유 지원#Triton#AMD#Multicast#Async Copy#gfx12502025년 11월 16일댓글 수 로딩 중