[SGLang] Model Loader: 가중치 로딩 인프라와 최적화SGLang의 Model Loader를 분석한다. Safetensors/PyTorch 가중치 로딩, 텐서 병렬 분산, 양자화 가중치 처리, 메모리 매핑 최적화를 코드와 함께 살펴본다.#sglang#Model Loader#Weight Loading#Safetensors2026년 4월 11일댓글 수 로딩 중