#Reverse-Engineered Reasoning (REER)

1개의 포스트

[논문리뷰] Reverse-Engineered Reasoning for Open-Ended Generation

개방형(open-ended) 및 창의적 생성과 같이 검증 불가능한 도메인에서 대규모 언어 모델(LLM)에 깊이 있는 추론 능력 을 부여하는 것이 이 연구의 핵심 목표입니다. 기존의 강화 학습(RL) 및 증류(distillation) 방식의 한계, 즉 명확한 보상 신호 부재 및 높은 비용 문제를 극복하고자 합니다.

#Review #Deep Reasoning #Open-Ended Generation #Reverse-Engineered Reasoning (REER)#LLMs #Synthetic Data #Iterative Refinement #Perplexity Minimization #DeepWriting-20K

2025년 9월 9일