#Diffusion Priors

1개의 포스트

[논문리뷰] UniVidX: A Unified Multimodal Framework for Versatile Video Generation via Diffusion Priors

기존의 비디오 생성 연구들은 각 문제 설정(예: Text-to-Video, Inverse Rendering)에 대해 개별적인 모델을 학습시키는 파편화된 방식을 취하고 있어, 고정된 입력-출력 매핑에 제한되고 모달리티 간의 상호 상관관계를 활용하지 못하는 한계가 있습니다.

#Review #Video Diffusion Models #Multimodal Video Generation #Intrinsic Decomposition #Diffusion Priors #Stochastic Condition Masking #Decoupled Gated LoRA #Cross-Modal Self-Attention

2026년 5월 3일