[논문리뷰] MilliVid: Hierarchical Latents for Long-Range Consistency in Video Generation본 논문은 기존 비디오 생성 모델들이 직면한 긴 영상 생성 시 발생하는 Temporal Inconsistency와 정보의 누락 문제를 해결하고자 합니다. 기존의 프레임 단위 또는 짧은 세그먼트 기반의 생성 방식은 시간이 지날수록 전역적 구조를 잃어버리는 한계가 있습니다.#Review#Video Generation#Hierarchical Latents#Long-Range Consistency#Diffusion Models#Latent Space#Spatiotemporal Modeling2026년 6월 9일댓글 수 로딩 중
[논문리뷰] NTIRE 2026 Challenge on Video Saliency Prediction: Methods and Results본 챌린지에서는 총 2,000개의 다양한 비디오로 구성된 새로운 데이터셋을 활용하였으며, 7개의 최종 팀이 제안한 모델들을 평가했습니다. 우승 팀인 iLearn은 InternVideo2 백본을 공유하고 두 개의 상호 보완적인 디코더를 앙상블(Ensemble)하는 다중 전문가 프레임워크를 제안했습니다 .#Review#Video Saliency Prediction#Crowdsourcing#Foundation Models#Spatiotemporal Modeling#NTIRE 2026 Challenge2026년 4월 19일댓글 수 로딩 중