#Genre Instability

1개의 포스트

[논문리뷰] Beyond Correctness: Evaluating Subjective Writing Preferences Across Cultures

본 논문은 기존 RLHF 보상 모델이 객관적인 품질 신호(문법 오류, 사실 정확성 등)를 제거했을 때 주관적인 쓰기 선호도 평가에서 성능이 크게 저하되는 문제를 해결하고자 합니다.

#Review #Subjective Preference Learning #Writing Evaluation #Reward Models #RLHF #Cross-Cultural AI #Generative Models #Language Model Judges #Genre Instability

2025년 10월 17일