[Triton] Hopper에서 소규모 배치 크기 벤치마크 수정Hopper GPU에서 small batch MLP 벤치마크의 num_warps 설정과 테스트 케이스 추가#Triton#Benchmark#Hopper#MLP#Bug Fix2025년 12월 4일댓글 수 로딩 중
[Triton] swizzling=0 matrix descriptor 지원과 WGMMA lowering 일반화swizzling이 0인 경우의 matrix descriptor 생성과 SharedLinearEncoding 기반의 WGMMA lowering을 구현#Triton#NVIDIA#WGMMA#Hopper#SharedLayout2025년 10월 6일댓글 수 로딩 중