[vLLM] Preemption & Async Scheduling: 선점과 비동기 스케줄링vLLM v1 스케줄러의 선점 메커니즘과 비동기 스케줄링을 분석한다. waiting/running 큐 관리, KV 커넥터 통합, 멀티모달 예산 관리를 살펴본다.#vllm#scheduler#preemption#async#memory-management2026년 4월 8일댓글 수 로딩 중
[vLLM] AsyncLLM: 비동기 엔진의 최상위 객체vLLM v1의 AsyncLLM 클래스가 어떻게 비동기 요청 처리, 멀티프로세스 EngineCore 통신, 스트리밍 출력을 조율하는지 코드 레벨에서 분석한다.#vllm#async#inference engine#LLM serving2026년 4월 7일댓글 수 로딩 중
[pytest] async fixture를 플러그인 없이 요청 시 hard error로 전환pytest 9에서 async fixture를 처리할 플러그인 없이 요청하면 경고 대신 즉시 에러를 발생시키도록 변경#Python#pytest#async#Breaking Change#Fixtures2025년 11월 30일댓글 수 로딩 중