[vLLM] LoRA (Multi-LoRA Serving): 저차원 어댑터 서빙vLLM이 하나의 베이스 모델 위에서 여러 LoRA 어댑터를 동시에 서빙하는 Multi-LoRA 아키텍처를 코드와 함께 분석한다.#vllm#lora#fine-tuning#multi-tenant serving2026년 4월 7일댓글 수 로딩 중