#Runtime

3개의 포스트

[triton] PyTorch 없이 Triton CUDA 백엔드 독립 사용 지원

Triton의 CUDA 백엔드에서 PyTorch 의존성을 제거하여, 순수 Python 환경에서도 GPU 커널을 컴파일하고 실행할 수 있도록 한 PR을 분석합니다.

#Triton #CUDA #PyTorch #Runtime #Independence

2026년 3월 5일

[triton] 컴파일된 커널 모듈 명시적 unload 지원

Triton 런타임에서 컴파일된 커널 모듈을 명시적으로 unload할 수 있도록 __del__ 메서드와 unload_module 드라이버 함수를 추가한 PR을 분석합니다.

#Triton #Runtime #Memory Management #CUDA #HIP

2026년 2월 17일

[triton] CUDA 가변 인자 Pre-compiled Launcher로 커널 런치 오버헤드 제거

Triton의 CUDA/HIP 커널 런처를 Python 문자열 치환 방식에서 C 기반 가변 인자 방식으로 전환하여 런치 오버헤드를 제거한 PR을 분석합니다.

#Triton #CUDA #HIP #Runtime #Performance

2026년 1월 21일