[vLLM] Mamba (SSM): 선형 시간 복잡도 시퀀스 모델링vLLM의 Mamba SSM attention backend 구현을 분석한다. Transformer의 이차 복잡도를 넘어 선형 시간에 시퀀스를 처리하는 Mamba의 상태 관리, 프리픽스 캐싱, 투기적 디코딩 지원을 살펴본다.#vllm#mamba#SSM#state space model#attention backend2026년 4월 7일댓글 수 로딩 중