#LLM Ensembling

1개의 포스트

[논문리뷰] When to Ensemble: Identifying Token-Level Points for Stable and Fast LLM Ensembling

본 논문은 LLM(Large Language Model) 앙상블이 장문(long-form) 생성에서 겪는 불안정성과 비효율성 문제를 해결하는 것을 목표로 합니다.

#Review #LLM Ensembling #Token-level Ensembling #Speculative Decoding #Tokenization Mismatch #Probability Sharpening #Long-form Generation #KV Cache Management

2025년 10월 21일