[논문리뷰] Quantitative Video World Model Evaluation for Geometric-Consistency본 연구는 현존하는 생성형 비디오 모델이 시각적으로는 고품질을 구현하지만, 엄격한 물리적 법칙을 따르는 3D 공간 이해도는 낮다는 점을 해결하고자 합니다.#Review#Video World Models#Geometric Consistency#PDI-Bench#3D Lifting#Perspective Distortion Index#Physical Realism2026년 5월 14일댓글 수 로딩 중
[논문리뷰] OpenSpatial: A Principled Data Engine for Empowering Spatial Intelligence본 논문은 기존 MLLM이 언어적 능력에 비해 공간 이해 능력(거리 측정, 다중 뷰 일관성 등)이 현저히 떨어지는 'Spatial Myopia' 문제를 해결하고자 한다. 기존 연구들은 고정된 데이터셋만을 배포할 뿐, 공간 데이터를 생성하는 엔진 자체를 비공개로 운영하여 데이터의 확장성과 재현성을 저해하고 있다.#Review#Spatial Intelligence#Data Engine#3D Bounding Boxes#Multimodal Large Language Models#Data Scaling#3D Lifting2026년 4월 9일댓글 수 로딩 중