[논문리뷰] Hybrid Policy Distillation for LLMsPengfei Liu이 arXiv에 게시한 'Hybrid Policy Distillation for LLMs' 논문에 대한 자세한 리뷰입니다.#Review#Knowledge Distillation#Large Language Models#Forward-Reverse KL#Policy Distillation#Logit-level Reweighting#On-policy Sampling2026년 4월 23일댓글 수 로딩 중