[논문리뷰] PanoWorld: Towards Spatial Supersensing in 360^circ Panorama World기존의 MLLM들은 인간의 시야각과 유사한 perspective-image 패러다임에 의존하여 360° 환경을 파악하는 데 한계를 보입니다.#Review#Multimodal Large Language Models#Panorama#Equirectangular Projection#Spatial Reasoning#Spatial Supersensing#Instruction Tuning2026년 5월 14일댓글 수 로딩 중
[논문리뷰] Cambrian-S: Towards Spatial Supersensing in Video본 논문은 현재 멀티모달 대규모 언어 모델(MLLM)이 비디오를 단편적인 프레임으로 처리하고 공간 구조를 제대로 이해하지 못하며, 언어적 기억에 과도하게 의존하는 한계를 지적합니다.#Review#Spatial Supersensing#Video Understanding#Multimodal LLMs#Predictive Sensing#Memory Management#Event Segmentation#VSI-SUPER#Instruction Tuning2025년 11월 9일댓글 수 로딩 중