[논문리뷰] ViMU: Benchmarking Video Metaphorical Understanding본 논문은 현대의 영상 이해 모델들이 표면적인 시각 정보(객체 인식, 행동 분류 등) 인식에는 뛰어나지만, 영상에 내재된 은유적이고 사회적인 의미를 파악하는 능력은 현저히 부족하다는 문제 의식에서 출발한다 .#Review#Video Understanding#Metaphorical Understanding#Subtext Interpretation#Multimodal Benchmark#Rhetorical Mechanisms#Social Value Signals2026년 5월 14일댓글 수 로딩 중