[triton] Proton CUPTI Graph Replay 힙 증가 재현 테스트 추가CUDA graph replay 중 CUPTI 라이브러리의 메모리 누수를 체계적으로 재현하고 프로파일링하는 테스트 스크립트를 분석합니다.#Triton#Proton#Profiling#CUDA#MemoryLeak2026년 3월 31일댓글 수 로딩 중
[triton] Proton 커널 런처에 더 많은 메타데이터 전달Proton의 metric 커널 런치에 numThreads와 sharedMemBytes 등 추가 메타데이터를 전달하여 GPU 자원 활용을 정밀하게 제어하도록 개선한 사례를 분석합니다.#Triton#Proton#Profiling#GPU#KernelLaunch2026년 2월 26일댓글 수 로딩 중
[triton] Backend별 global_scratch_alloc 할당 통합Proton 프로파일러의 scratch 메모리를 별도 풀로 분리하고, third-party allocation 지원을 추가하여 global scratch 메모리 관리를 통합한 사례를 분석합니다.#Triton#GPU#MemoryAllocation#Proton#Refactoring2026년 2월 26일댓글 수 로딩 중
[Triton] Proton 프로파일러에서 불필요한 lock 추가 제거PhaseStore를 분리하고 atomic 연산을 활용하여 프로파일링 오버헤드를 줄이는 lock 최적화#Triton#Proton#Profiler#Performance#Concurrency2026년 1월 21일댓글 수 로딩 중
[Triton] Proton에서 선택적 커널 메타데이터 기록 및 커스텀 메트릭 지원LaunchHook에 include/exclude 필터와 임의 메트릭 지원을 추가하여 프로파일링 유연성 향상#Triton#Proton#Profiler#Metadata#Performance2026년 1월 15일댓글 수 로딩 중
[Triton] Proton GlobalScratchAllocOp 폐기 — TritonGPU 공용 op으로 통합Proton 전용 GlobalScratchAllocOp을 TritonGPU의 공용 op으로 교체하고, backend 속성으로 할당 정책을 구분한다#Triton#Proton#MLIR#Refactoring#Op Deprecation2026년 1월 7일댓글 수 로딩 중
[triton] Proton의 Runtime과 Metric 상관관계 단순화로 오버헤드 감소Proton 프로파일러의 Data/Metric 인터페이스를 재설계하여 이중 잠금과 불필요한 조회를 제거하고 프로파일링 오버헤드를 줄인 사례를 분석합니다.#Triton#Proton#Profiling#Performance#Refactoring2026년 1월 4일댓글 수 로딩 중
[Triton] Proton 프로파일러 tensor descriptor 및 two-CTA 모드 테스트 추가Proton 프로파일러에 tensor descriptor와 two-CTA 모드 커널에 대한 테스트를 추가하여 프로파일링 범위를 확장한다#Triton#Proton#Testing#Tensor Descriptor#Two-CTA2025년 12월 23일댓글 수 로딩 중
[Triton] Proton 메모리 누수 수정 및 미사용 변수 제거Proton 프로파일러의 메모리 누수를 수정하고 미사용 변수를 정리하여 리소스 관리를 개선한다#Triton#Proton#Memory Leak#Bug Fix#Code Cleanup2025년 11월 11일댓글 수 로딩 중
[Triton] Proton 기본 버퍼 크기 설명 개선 — 문서화와 코드 주석 보강Proton 프로파일러의 기본 버퍼 크기 설정에 대한 문서와 코드 주석을 명확하게 개선한다#Triton#Proton#Documentation#Profiling#Developer Experience2025년 11월 8일댓글 수 로딩 중
[triton] Proton 커널 내 프로파일러 Global Memory 지원Triton Proton의 intra-kernel profiler에 global memory buffer 지원을 추가하여, shared memory가 부족한 환경에서도 프로파일링이 가능하도록 한 PR을 분석합니다.#Triton#Proton#Profiler#Global Memory#GPU Performance2025년 11월 5일댓글 수 로딩 중