[sglang] sgl-kernel 레거시 경로 대규모 제거: AOT에서 JIT로의 전환 완성SGLang에서 sgl-kernel AOT(Ahead-of-Time) 빌드 의존성 1,708줄을 삭제하고 JIT 커널만 남긴 대규모 정리 분석.#SGLang#sgl-kernel#JIT#AOT#Cleanup#CUDA#C++2026년 4월 1일댓글 수 로딩 중
[CPython] dict 접근 최적화: known hash를 활용한 중복 해시 계산 제거CPython의 dict 자료구조에서 이미 알고 있는 hash 값을 활용하여 중복 해시 연산을 제거하는 JIT/인터프리터 최적화 분석.#CPython#Performance#Dict#JIT#Optimization#C2026년 3월 30일댓글 수 로딩 중
[CPython] JIT stencil에서 frame pointer 보존 검증 추가CPython JIT 컴파일러가 생성하는 stencil 코드에서 frame pointer가 올바르게 보존되는지 검증하는 validation 로직 분석.#CPython#JIT#Frame Pointer#Debugging#Profiling#AArch64#x862026년 3월 27일댓글 수 로딩 중
[CPython] AArch64 JIT stencil에서 frame pointer 예약 활성화AArch64 Linux 환경의 CPython JIT에서 frame pointer를 reserved로 설정하여 네이티브 프로파일러 호환성을 확보한 분석.#CPython#JIT#AArch64#Frame Pointer#Profiling#Linux2026년 3월 27일댓글 수 로딩 중
[cpython] CPython JIT 최적화: Float 연산의 In-place 변환을 통한 성능 향상CPython JIT의 Tier 2 옵티마이저에서 고유 참조된 Float 피연산자를 In-place로 변환하여 메모리 할당을 줄이고 성능을 개선하는 방법.#CPython#JIT#Optimization#Python Internals#Performance2026년 3월 24일댓글 수 로딩 중
[CPython] JIT float 연산 최적화 — 유일 참조 피연산자 재사용CPython JIT에서 유일 참조 float 객체를 in-place 변경하여 메모리 할당을 제거한다#CPython#JIT#Optimization#Float2026년 3월 24일댓글 수 로딩 중
[Triton] preload에 optional device 인자 추가JIT 함수의 preload 메서드에 device 인자를 추가하여 특정 디바이스에서 커널을 사전 로드할 수 있도록 개선#Triton#JIT#Frontend#Python2025년 12월 9일댓글 수 로딩 중
[triton] Triton JIT 컴파일러 최적화: `inspect.getclosurevars` 제거를 통한 10,000배 성능 향상Triton JIT 컴파일러에서 `inspect.getclosurevars`를 제거하여 캡처 스코프 조회 속도를 10,000배 향상시켰습니다.#Triton#JIT#성능 최적화#Python#컴파일러#inspect2025년 11월 25일댓글 수 로딩 중
[Triton] Aggregate 멤버를 cache key에 포함시키기JIT 함수에 전달되는 aggregate 타입의 멤버를 cache key에 반영하여 캐시 일관성 보장#Triton#Frontend#Cache#JIT2025년 10월 24일댓글 수 로딩 중
[triton] ConSan: 상태 변경 시 커널 재컴파일을 보장하여 JIT 캐시 무효화Concurrency Sanitizer 상태를 컴파일 옵션에 포함시켜 활성화/비활성화 시 커널이 자동으로 재컴파일되도록 하는 변경 분석.#Triton#ConSan#JIT#Cache#Sanitizer#Debugging2025년 10월 1일댓글 수 로딩 중