[SGLang] Piecewise CUDA Graph: 분할 그래프 컴파일 전략SGLang의 Piecewise CUDA Graph를 분석한다. 모델을 여러 조각으로 분할하여 CUDA Graph를 캡처하는 전략, 동적 형상 지원, 메모리 효율성을 코드와 함께 살펴본다.#sglang#Piecewise CUDA Graph#Graph Compilation#Dynamic Shapes2026년 4월 11일댓글 수 로딩 중