[SGLang] EAGLE CUDA Graph: 드래프트 모델 가속SGLang의 EAGLE CUDA Graph Runner를 분석한다. 드래프트 모델의 반복 실행을 CUDA Graph로 캡처하여 오버헤드를 제거하는 전략을 코드와 함께 살펴본다.#sglang#EAGLE CUDA Graph#Draft Acceleration#Graph Capture2026년 4월 13일댓글 수 로딩 중