[논문리뷰] MilliVid: Hierarchical Latents for Long-Range Consistency in Video Generation본 논문은 기존 비디오 생성 모델들이 직면한 긴 영상 생성 시 발생하는 Temporal Inconsistency와 정보의 누락 문제를 해결하고자 합니다. 기존의 프레임 단위 또는 짧은 세그먼트 기반의 생성 방식은 시간이 지날수록 전역적 구조를 잃어버리는 한계가 있습니다.#Review#Video Generation#Hierarchical Latents#Long-Range Consistency#Diffusion Models#Latent Space#Spatiotemporal Modeling2026년 6월 9일댓글 수 로딩 중