#PDDL Planning

2개의 포스트

[논문리뷰] Reasoning Core: A Scalable Procedural Data Generation Suite for Symbolic Pre-training and Post-Training

이 논문은 대규모 언어 모델(LLM)의 추론 능력 확장을 위해 기존 생성 방식의 분포적 다양성 부족 문제를 해결하고자 합니다.

#Review #Procedural Data Generation #Symbolic Reasoning #Language Model Pre-training #Reinforcement Learning with Verifiable Rewards #Formal Logic #PDDL Planning #Context-Free Grammars

2026년 3월 2일

[논문리뷰] Reasoning Core: A Scalable RL Environment for LLM Symbolic Reasoning

본 연구는 LLM의 기초적인 기호 추론 능력을 향상시키기 위한 확장 가능한 RLVR (Reinforcement Learning with Verifiable Rewards) 환경인 Reasoning Core 를 소개합니다.

#Review #LLM Reasoning #Symbolic AI #Reinforcement Learning #Procedural Content Generation #Verifiable Rewards #Adaptive Curricula #First-Order Logic #PDDL Planning

2025년 9월 23일