#OREAL-H

1개의 포스트

[논문리뷰] Long-horizon Reasoning Agent for Olympiad-Level Mathematical Problem Solving

본 논문은 대규모 추론 모델(LRM)이 국제 수학 올림피아드(IMO) 수준의 초고난도 수학 문제를 해결하는 데 있어 긴 컨텍스트 길이의 제약 으로 인해 발생하는 병목 현상을 극복하는 것을 목표로 합니다.

#Review #Mathematical Reasoning #Long-Horizon Reasoning #Multi-Agent System #Reinforcement Learning #Olympiad Problems #Lemma Memory #Context Length #OREAL-H

2025년 12월 11일