[논문리뷰] M^3Eval: Multi-Modal Memory Evaluation through Cognitively-Grounded Video Tasks본 논문은 현존하는 많은 멀티모달 모델이 짧은 컨텍스트 내의 정보 이해에는 능숙하지만, 복잡한 비디오 시퀀스에서 장기적인 기억을 유지하는 데는 심각한 한계가 있다는 점을 지적합니다. 기존 벤치마크들은 주로 단기적 정보 인식에 치중되어 있어, 인간처럼 긴 시간 동안 사건을 축적하고 재구성하는 능력을 측정하기 어렵습니다.#Review#Multi-Modal Memory#Video Understanding#Benchmark#Cognitive Science#Long-term Memory2026년 6월 3일댓글 수 로딩 중