#Process-Verified Benchmark

1개의 포스트

[논문리뷰] Agentic-MME: What Agentic Capability Really Brings to Multimodal Intelligence?

본 논문은 MLLM이 단순한 관찰자에서 능동적 에이전트로 진화함에 따라, 시각적 조작과 지식 검색의 결합 능력을 체계적으로 평가할 필요성을 제기합니다. 기존의 벤치마크들은 도구 통합의 유연성이 부족하거나, 시각적 도구와 웹 검색을 독립적으로 평가하여 이들의 Synergy 를 간과하고 있습니다.

#Review #Multimodal Large Language Models #Agentic Capability #Visual Expansion #Knowledge Expansion #Process-Verified Benchmark #Synergistic Reasoning

2026년 4월 5일