[논문리뷰] Woosh: A Sound Effects Foundation ModelarXiv에 게시된 'Woosh: A Sound Effects Foundation Model' 논문에 대한 자세한 리뷰입니다.#Review#Foundation Model#Sound Effects#Latent Diffusion Model#Flow Matching#Audio-Visual Generation#Distillation2026년 4월 2일댓글 수 로딩 중
[논문리뷰] AVControl: Efficient Framework for Training Audio-Visual ControlsarXiv에 게시된 'AVControl: Efficient Framework for Training Audio-Visual Controls' 논문에 대한 자세한 리뷰입니다.#Review#Audio-Visual Generation#Video Control#LoRA#Parallel Canvas Conditioning#Diffusion Models#Modularity#Efficiency2026년 3월 26일댓글 수 로딩 중
[논문리뷰] Seedance 1.5 pro: A Native Audio-Visual Joint Generation Foundation ModelarXiv에 게시된 'Seedance 1.5 pro: A Native Audio-Visual Joint Generation Foundation Model' 논문에 대한 자세한 리뷰입니다.#Review#Audio-Visual Generation#Diffusion Transformer#Multimodal AI#Speech Synchronization#Video Generation#Reinforcement Learning from Human Feedback#Inference Acceleration2025년 12월 18일댓글 수 로딩 중
[논문리뷰] Harmony: Harmonizing Audio and Video Generation through Cross-Task SynergyarXiv에 게시된 'Harmony: Harmonizing Audio and Video Generation through Cross-Task Synergy' 논문에 대한 자세한 리뷰입니다.#Review#Audio-Visual Generation#Cross-Modal Synchronization#Diffusion Models#Cross-Task Synergy#Classifier-Free Guidance#Multimodal AI#Generative AI2025년 11월 26일댓글 수 로딩 중