#Critique-Post-Edit

1개의 포스트

[논문리뷰] Towards Faithful and Controllable Personalization via Critique-Post-Edit Reinforcement Learning

본 논문은 대규모 언어 모델(LLM)의 개인화가 사용자의 개별적인 선호도에 충실하게 부합하도록 하는 도전적인 문제를 해결하고자 합니다.

#Review #LLM Personalization #Reinforcement Learning #Generative Reward Model #Critique-Post-Edit #Reward Hacking #Controllable AI

2025년 10월 22일