[논문리뷰] One Life to Learn: Inferring Symbolic World Models for Stochastic Environments from Unguided Exploration본 논문은 복잡하고 확률적인 환경에서 제한된 상호작용 예산('one life')과 인간의 보상/목표와 같은 외부 안내 없이 기호적 월드 모델을 학습하는 어려운 문제를 해결하는 것을 목표로 합니다. 이전 연구들이 주로 결정론적 환경, 풍부한 데이터, 인간의 지시에 의존했던 한계를 극복하고자 합니다.#Review#Symbolic World Models#Stochastic Environments#Unguided Exploration#Probabilistic Programming#Law Synthesis#Crafter-OO#Program Synthesis2025년 10월 15일댓글 수 로딩 중