#Masked Token Prediction

1개의 포스트

[논문리뷰] Set Block Decoding is a Language Model Inference Accelerator

본 논문은 대규모 언어 모델(LLM) 추론, 특히 디코딩 단계에서 발생하는 높은 계산 및 메모리 비용 문제에 초점을 맞춥니다.

#Review #Language Model Inference #Acceleration #Set Block Decoding #Next Token Prediction #Masked Token Prediction #Parallel Decoding #KV-caching #Diffusion Models

2025년 9월 8일