[논문리뷰] JetSpec: Breaking the Scaling Ceiling of Speculative Decoding with Parallel Tree Drafting본 논문은 기존 Speculative Decoding 방식이 직면한 확장성(Scalability) 한계, 즉 '인과성-효율성 딜레마(Causality-Efficiency Dilemma)'를 해결하고자 한다 .#Review#Speculative Decoding#Parallel Tree Drafting#Causal Attention#LLM Inference#Latency Reduction2026년 6월 25일댓글 수 로딩 중