[논문리뷰] VideoKR: Towards Knowledge- and Reasoning-Intensive Video Understanding본 논문은 현대의 멀티모달 모델들이 단순한 시각적 인식을 넘어 전문적인 도메인 지식과 다단계 추론이 필요한 비디오 이해 태스크에서 한계를 보인다는 점을 지적한다.#Review#Video Understanding#Knowledge-Intensive Reasoning#Training Corpus#CoT#Benchmark#Skill-Oriented#Reinforcement Learning2026년 6월 4일댓글 수 로딩 중