[논문리뷰] RoboCurate: Harnessing Diversity with Action-Verified Neural Trajectory for Robot Learning
링크: 논문 PDF로 바로 열기
저자: Seungku Kim, Suhyeok Jang, Byungjun Yoon, Dongyoung Kim, John Won, Jinwoo Shin
핵심 연구 목표
로봇 학습을 위한 비디오 생성 모델 기반 합성 데이터는 액션 품질의 일관성 부족과 물리적 정확성 검증의 어려움으로 인해 제한적인 성능을 보입니다. 본 논문은 이러한 한계를 극복하기 위해 시뮬레이션 재생을 통한 액션 검증 및 시각적 다양성 증대 를 통해 고품질의 합성 로봇 데이터를 생성하고 필터링하는 프레임워크인 RoboCurate 를 제안합니다.
핵심 방법론
RoboCurate 는 두 단계로 진행됩니다. 첫째, 생성 단계에서는 image-to-image (I2I) 편집 및 video-to-video (V2V) 전송 을 사용하여 초기 장면과 외관의 시각적 다양성을 대폭 확장하고, VLM 을 통해 실제적이고 다양한 작업 지침을 생성합니다. 둘째, 필터링 단계에서는 IDM(Inverse Dynamics Model)으로 예측된 액션 을 시뮬레이터에서 재현하여 생성된 비디오와 시뮬레이터 롤아웃 간의 시각적 동작 일관성 을 측정합니다. 이를 위해 사전 훈련된 비디오 인코더(V-JEPA2) 위에 구축된 경량의 어텐티브 프로브 를 사용하여 액션 일관성을 분류하고, 높은 일관성을 보이는 샘플만 선별합니다.
주요 결과
RoboCurate 는 사전 훈련 단계에서 GR-1 Tabletop (300 데모) 에서 실제 데이터만 사용한 기준선 대비 +70.1% 의 성공률 향상을, DexMimicGen 에서 +16.1% 의 향상을 달성했습니다. 실제 로봇 ALLEX 휴머노이드 의 공동 미세 조정 설정에서는 성공률에서 +179.9% 의 상대적 개선을 보였으며, 새로운 액션 태스크에서 0.0%에서 25.0% 까지 성공률을 높여 강력한 분포 외 일반화 능력을 입증했습니다. 제안된 액션 검증 필터링 전략은 VLM 기반의 물리적 타당성 검증 이나 단순 코사인 유사도 와 같은 다른 필터링 전략보다 우수한 성능을 나타냈습니다.
AI 실무자를 위한 시사점
AI 실무자들은 RoboCurate 를 통해 로봇 학습에 필요한 고품질 합성 데이터를 효율적으로 생성하고 선별할 수 있습니다. 특히, 시뮬레이션 재생을 통한 액션-레벨 검증 은 생성된 비디오의 단순한 물리적 타당성보다 정책 학습에 훨씬 더 중요하며 효과적임을 시사합니다. 또한, 시각적 및 태스크 다양성 증가는 로봇 정책의 일반화 성능을 크게 향상시키므로, 적은 실세계 데이터로도 강력한 로봇 제어 정책을 학습하는 데 기여할 수 있습니다.
⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.
Review 의 다른글
- 이전글 [논문리뷰] Nacrith: Neural Lossless Compression via Ensemble Context Modeling and High-Precision CDF Coding
- 현재글 : [논문리뷰] RoboCurate: Harnessing Diversity with Action-Verified Neural Trajectory for Robot Learning
- 다음글 [논문리뷰] SenTSR-Bench: Thinking with Injected Knowledge for Time-Series Reasoning