[논문리뷰] SceneCode: Executable World Programs for Editable Indoor Scenes with Articulated Objects본 연구는 기존의 정적인 3D 장면 표현 방식이 실내 공간의 동적 특성과 가동부를 효과적으로 편집하는 데 한계가 있다는 문제 의식에서 출발합니다.#Review#3D Scene Understanding#Executable World Programs#Articulated Objects#Scene Editing#Inverse Graphics#Program Synthesis2026년 5월 19일댓글 수 로딩 중
[논문리뷰] OpenVoxel: Training-Free Grouping and Captioning Voxels for Open-Vocabulary 3D Scene Understanding기존 3D 장면 이해 방법론들이 훈련된 임베딩과 대규모 수동 주석, 긴 훈련 시간에 의존하는 한계를 극복하고자 합니다. OpenVoxel은 훈련 없이 희소 복셀을 그룹화하고 캡셔닝하여 오픈-vocabulary 3D 장면 이해 태스크를 수행하며, 특히 복잡한 자연어 질의에 효과적으로 대응하는 것을 목표로 합니다.#Review#3D Scene Understanding#Open-Vocabulary Segmentation#Referring Expression Segmentation#Training-Free#Voxel Grouping#Vision-Language Models#Multi-modal Large Language Models#Sparse Voxel Rasterization2026년 1월 14일댓글 수 로딩 중
[논문리뷰] TUN3D: Towards Real-World Scene Understanding from Unposed Images본 논문은 실세계 스캔에서 정확한 카메라 포즈나 깊이 정보 없이 다중 뷰 이미지 입력만으로 조인트 레이아웃 추정(layout estimation) 과 3D 객체 감지(3D object detection) 를 수행하는 최초의 방법론인 TUN3D 를 제시합니다.#Review#3D Scene Understanding#Layout Estimation#3D Object Detection#Unposed Images#Sparse Convolutional Networks#Multi-view Stereo#Real-time AI2025년 9월 29일댓글 수 로딩 중