[논문리뷰] Duration Aware Scheduling for ASR Serving Under Workload Drift본 논문은 대규모 ASR 시스템에서 FCFS 기반 스케줄링이 작업 시간의 가변성을 고려하지 못해 발생하는 비효율성 문제를 해결한다. 기존의 vLLM과 같은 서빙 엔진들은 입력을 순차적으로 처리하므로, 긴 오디오 요청이 짧은 요청들을 가로막는 Head-of-Line blocking 현상이 빈번하게 발생한다.#Review#ASR#Scheduling#Latency#vLLM#Whisper#Workload Drift#SJF#HRRN2026년 6월 18일댓글 수 로딩 중