[vLLM] 기타 Model Layers: Pooler, Resampler, Vocab Parallel Embedding 등vLLM의 핵심 모델 레이어들을 분석한다. VocabParallelEmbedding의 텐서 병렬 분할, Resampler의 멀티모달 처리, Pooler의 추상화를 살펴본다.#vllm#model-layers#embedding#pooler#tensor-parallel2026년 4월 8일댓글 수 로딩 중
[vLLM] Pooling Tasks: 임베딩, 분류, 스코어링vLLM이 생성 태스크 외에 임베딩, 분류, 스코어링을 지원하는 Pooling 시스템의 구조를 분석한다.#vllm#embedding#pooling#classification2026년 4월 7일댓글 수 로딩 중