#Token Generation

2개의 포스트

[SGLang] Disaggregated Decode 서버: 디코드 전용 서버 구현

SGLang의 Disaggregated Decode 서버를 분석한다. 디코드 전용 서버의 KV 캐시 수신, 토큰 생성 루프, Prefill 서버로부터의 상태 전달을 코드와 함께 살펴본다.

#sglang #Disaggregated Decode #Token Generation #Decode Server

2026년 4월 13일

[논문리뷰] Where MLLMs Attend and What They Rely On: Explaining Autoregressive Token Generation

Multimodal Large Language Models (MLLMs)의 자동 회귀 토큰 생성 과정에서 시각적 입력이 출력 토큰에 미치는 영향을 설명하고, 언어적 선험 지식과 지각적 증거의 상대적 영향력을 정량화하는 것을 목표로 합니다.

#Review #MLLM #Interpretability #Attribution #Token Generation #Black-box Explanation #Hallucination Diagnosis #Multimodality #VQA

2025년 9월 29일