#Power Sampling

1개의 포스트

[논문리뷰] Scalable Power Sampling: Unlocking Efficient, Training-Free Reasoning for LLMs via Distribution Sharpening

본 논문의 핵심 목표는 LLM의 추론 성능을 향상시키는 데 사용되는 강화 학습(RL) 기반 후처리 및 MCMC(Markov Chain Monte Carlo) 기반 파워 샘플링 의 높은 계산 비용 문제를 해결하는 것입니다.

#Review #LLM Reasoning #Distribution Sharpening #Power Sampling #Training-Free #Monte Carlo Estimation #Jackknife Correction #Autoregressive Generation #Inference Efficiency

2026년 1월 29일