#Autoregressive Video Synthesis

1개의 포스트

[논문리뷰] OmniForcing: Unleashing Real-time Joint Audio-Visual Generation

최근 LTX-2 와 Veo 3 와 같은 Joint Audio-Visual Diffusion Model들은 탁월한 Generation Quality를 보여주지만, Bidirectional Attention Dependency로 인해 높은 Latency를 겪어 Real-time Application에 적용하기 어렵습니다.

#Review #Streaming Audio-Visual Generation #Diffusion Distillation #Autoregressive Video Synthesis #Multi-modal AI

2026년 3월 15일