[논문리뷰] Native Active Perception as Reasoning for Omni-Modal Understanding본 논문은 기존의 패시브한 Long Video Understanding 모델들이 가진 컴퓨팅 자원 및 성능의 한계를 해결하기 위해 제안되었습니다. 기존 연구들은 비디오 전체를 균일하게 처리하거나 전역적 사전 스캔에 의존함으로써, 비디오 길이에 따라 계산 비용이 선형적으로 증가하는 고질적인 병목 현상을 겪고 있습니다 .#Review#Omni-modal Understanding#Active Perception#POMDP#Agentic Reasoning#Test-time Scaling#TAURA#Reinforcement Learning2026년 6월 17일댓글 수 로딩 중