[논문리뷰] MobileEgo Anywhere: Open Infrastructure for long horizon egocentric data on commodity hardware본 논문은 대규모 VLA 모델 학습에 필수적인 장기 시점(long horizon)의 egocentric 데이터를 수집하기 위한 개방형 인프라를 구축하는 데 목적이 있습니다. 기존 데이터셋은 에피소드 길이가 짧고 고가의 하드웨어 장비에 의존해야 하는 등 확장성에 한계를 보입니다.#Review#Egocentric Data#Vision Language Action (VLA)#Long-horizon#SLAM#STERA#Smartphone-based Capture2026년 5월 17일댓글 수 로딩 중
[논문리뷰] FRAPPE: Infusing World Modeling into Generalist Policies via Multiple Future Representation Alignment본 논문은 Vision-Language-Action (VLA) 모델이 세계 모델링 능력을 향상시키는 데 직면한 두 가지 주요 문제(픽셀 단위 재구성에 대한 과도한 강조와 예측된 미래 관찰에 대한 의존으로 인한 오류 누적)를 해결하고자 합니다.#Review#World Modeling#Generalist Policies#Representation Alignment#Diffusion Models#Robotics#Fine-tuning#Egocentric Data#VLA2026년 2월 19일댓글 수 로딩 중
[논문리뷰] PhysBrain: Human Egocentric Data as a Bridge from Vision Language Models to Physical Intelligence본 연구는 시점 불일치 문제로 인해 로봇 일반화에 한계가 있는 기존 VLM(Vision-Language Model)의 단점을 해결하고자 합니다.#Review#Egocentric Data#Physical Intelligence#VLM#Robot Control#Embodied AI#VQA Supervision#Human-Robot Interaction#Zero-shot Transfer2025년 12월 21일댓글 수 로딩 중