[논문리뷰] VideoSeeker: Incentivizing Instance-level Video Understanding via Native Agentic Tool Invocation본 논문은 기존의 LLM 기반 비디오 이해 모델들이 겪는 공간적·시간적 참조의 모호성 문제를 해결하기 위해 VideoSeeker를 제안한다.#Review#Large Vision-Language Models#Instance-level Video Understanding#Visual Prompts#Agentic Tool Invocation#Reinforcement Learning#Data Synthesis Pipeline2026년 5월 18일댓글 수 로딩 중