[논문리뷰] Discrete-WAM: Unified Discrete Vision-Action Token Editing for World-Policy Learning본 논문은 기존 자율주행 시스템이 행동 조건부 동역학(Action-conditioned dynamics)을 명시적으로 모델링하지 못하고, 단순한 Direct State-to-Action Mapping에 의존한다는 근본적인 한계를 해결하고자 한다 .#Review#Autonomous Driving#World Model#Discrete Diffusion#Token Editing#Policy Learning#Counterfactual Reasoning2026년 6월 4일댓글 수 로딩 중
[논문리뷰] FrameSkip: Learning from Fewer but More Informative Frames in VLA Training본 논문은 기존 VLA 모델 학습 과정에서 무분별하게 모든 프레임을 동일한 비중으로 사용하는 'Temporal supervision imbalance' 문제를 해결하고자 합니다.#Review#Vision-Language-Action (VLA)#Robot Manipulation#Frame Selection#Temporal Supervision#Data Curation#Policy Learning#Embodied AI2026년 5월 13일댓글 수 로딩 중
[논문리뷰] TactAlign: Human-to-Robot Policy Transfer via Tactile Alignment웨어러블 장치(예: 촉각 장갑)를 통해 수집된 풍부한 인간 촉각 신호를 로봇으로 효과적으로 전이하는 문제를 해결하는 것을 목표로 합니다. 특히, 센서 모달리티와 신체적 구현의 차이에도 불구하고 인간의 촉각 데이터를 로봇의 촉각 공간에 정렬 하여 다양한 로봇 핸드에 대한 정책 학습의 확장성과 일반성을 향상시키고자 합니다.#Review#Human-to-Robot Transfer#Tactile Sensing#Cross-Embodiment#Policy Learning#Rectified Flow#Unpaired Data#Dexterous Manipulation#Latent Space Alignment2026년 2월 19일댓글 수 로딩 중
[논문리뷰] Genie Envisioner: A Unified World Foundation Platform for Robotic Manipulation본 논문은 로봇 조작을 위한 통합된 세계 파운데이션 플랫폼 (Genie Envisioner) 을 제시하여, 정책 학습, 평가 및 시뮬레이션을 단일 비디오-생성 프레임워크 내에서 통합하는 것을 목표로 합니다. 이는 기존 로봇 개발 과정의 단편적인 단계를 극복하고 확장 가능하며 범용적인 지능형 로봇 시스템 구축을 지향합니다.#Review#Robotic Manipulation#World Model#Video Generation#Diffusion Model#Embodied AI#Foundation Model#Robotics Simulation#Policy Learning2025년 8월 8일댓글 수 로딩 중