[논문리뷰] UniVidX: A Unified Multimodal Framework for Versatile Video Generation via Diffusion Priors기존의 비디오 생성 연구들은 각 문제 설정(예: Text-to-Video, Inverse Rendering)에 대해 개별적인 모델을 학습시키는 파편화된 방식을 취하고 있어, 고정된 입력-출력 매핑에 제한되고 모달리티 간의 상호 상관관계를 활용하지 못하는 한계가 있습니다.#Review#Video Diffusion Models#Multimodal Video Generation#Intrinsic Decomposition#Diffusion Priors#Stochastic Condition Masking#Decoupled Gated LoRA#Cross-Modal Self-Attention2026년 5월 3일댓글 수 로딩 중