[논문리뷰] Reasoning Core: A Scalable RL Environment for LLM Symbolic Reasoning본 연구는 LLM의 기초적인 기호 추론 능력을 향상시키기 위한 확장 가능한 RLVR (Reinforcement Learning with Verifiable Rewards) 환경인 Reasoning Core 를 소개합니다.#Review#LLM Reasoning#Symbolic AI#Reinforcement Learning#Procedural Content Generation#Verifiable Rewards#Adaptive Curricula#First-Order Logic#PDDL Planning2025년 9월 23일댓글 수 로딩 중