[논문리뷰] MARS: Enabling Autoregressive Models Multi-Token Generation본 논문은 기존의 AR 모델이 추론 시 토큰을 하나씩 생성함에 따라 발생하는 불필요한 컴퓨팅 자원 낭비 문제를 해결하고자 한다.#Review#MARS#Autoregressive Model#Multi-Token Generation#Inference Acceleration#Block-Masked Prediction#Instruction-tuned LLM2026년 4월 8일댓글 수 로딩 중