[논문리뷰] Self-Evaluation Is Already There: Eliciting Latent Judge Calibration in Base LLMs with Minimal Data본 논문은 LLM이 외부 Judge의 평가를 사전에 예측하여 스스로 자신의 답변을 재평가하거나 선별할 수 있는지에 대한 근본적인 의문을 탐구합니다.#Review#Large Language Models#Self-Evaluation#Calibration#Reinforcement Learning#Elicitation#Distillation#Alignment2026년 6월 8일댓글 수 로딩 중