[논문리뷰] Swift Sampling: Selecting Temporal Surprises via Taylor Series본 논문은 대부분의 비디오 데이터가 시간적으로 높은 중복성(Temporal Redundancy)을 가진다는 점에 착안하여, 제한된 frame budget 내에서 모델의 성능을 극대화할 수 있는 효율적인 프레임 선택 방식을 제안한다.#Review#Swift Sampling#Taylor Series#Predictive Coding#Video Large Language Models#Keyframe Selection#Temporal Surprise#Computational Efficiency2026년 5월 21일댓글 수 로딩 중
[논문리뷰] WorldMM: Dynamic Multimodal Memory Agent for Long Video Reasoning본 논문은 기존 비디오 LLM이 긴 비디오(수 시간~수 일)를 처리할 때 직면하는 제한된 컨텍스트 용량 및 시각적 세부 정보 손실 문제를 해결하고자 합니다.#Review#Long Video Reasoning#Multimodal Memory#Adaptive Retrieval#Video Large Language Models#Knowledge Graph#Multiscale Temporal Reasoning#Episodic Memory#Semantic Memory2025년 12월 2일댓글 수 로딩 중
[논문리뷰] Map the Flow: Revealing Hidden Pathways of Information in VideoLLMs본 논문은 Video Large Language Models ( VideoLLMs )가 비디오-텍스트 정보(spatiotemporal inputs)를 어떻게 내부적으로 추출하고 전파하여 비디오 질의응답 (VideoQA) 태스크에서 Temporal Reasoning을 수행하는지 그 메커니즘을 밝히는 것을 목표로 합니다.#Review#Video Large Language Models#VideoQA#Mechanistic Interpretability#Attention Knockout#Temporal Reasoning#Information Flow#Model Interpretability#Logit Lens2025년 10월 27일댓글 수 로딩 중