[논문리뷰] MaxProof: Scaling Mathematical Proof with Generative-Verifier RL and Population-Level Test-Time Scaling본 논문은 대규모 언어 모델이 수학적 증명 문제에서 겪는 Hallucination과 Logical Inconsistency 문제를 해결하는 것을 핵심 목표로 합니다.#Review#Mathematical Reasoning#Reinforcement Learning#Test-Time Scaling#Generative-Verifier#Formal Verification#Scalable Alignment2026년 6월 11일댓글 수 로딩 중