[논문리뷰] Scaling Zero-Shot Reference-to-Video Generation논문은 기존 R2V(Reference-to-Video) 생성 모델이 명시적인 R2V 데이터셋 에 의존하여 확장성과 일반화 능력이 제한되는 문제를 해결하고자 합니다. 이를 위해 명시적인 R2V 데이터 없이 순수한 대규모 비디오-텍스트 쌍 만을 사용하여 제로샷 R2V 생성 이 가능한 Saber 프레임워크를 제안합니다.#Review#Reference-to-Video Generation#Zero-Shot Learning#Diffusion Models#Masked Training#Video-Text Pairs#Identity Preservation#Scalability#Attention Mechanism2025년 12월 8일댓글 수 로딩 중