[논문리뷰] Conservative Offline Robot Policy Learning via Posterior-Transition Reweighting최근 Vision-Language-Action (VLA) model의 발전은 large-scale multi-robot dataset을 통해 robot policy를 pretrain하는 데 큰 진전을 보였습니다.#Review#Offline Reinforcement Learning#Vision-Language-Action Models#Data Reweighting#Posterior-Transition Reweighting#Cross-Embodiment Transfer#Robot Learning2026년 3월 18일댓글 수 로딩 중