[논문리뷰] V2M-Zero: Zero-Pair Time-Aligned Video-to-Music Generation논문은 기존 Text-to-Music(T2M) 모델의 한계인 비디오 이벤트와의 정밀한 시간 정렬 제어 부족 문제를 해결하고, V2M-ZERO 라는 Zero-Pair 비디오-투-음악 생성 접근 방식을 제안합니다.#Review#Video-to-Music Generation#Temporal Alignment#Zero-Pair Learning#Rectified Flow Model#Diffusion Transformer#Event Curves#Modality Gap Mitigation2026년 3월 11일댓글 수 로딩 중
[논문리뷰] NarraScore: Bridging Visual Narrative and Musical Dynamics via Hierarchical Affective Control본 논문은 긴 길이의 비디오에 대해 계산 효율적이고, 시간적으로 일관되며, 서사적 흐름에 의미론적으로 부합하는 배경 음악을 자동으로 생성하는 것을 목표로 합니다.#Review#Video-to-Music Generation#Affective Computing#Vision-Language Models (VLMs)#Hierarchical Control#Soundtrack Generation#Temporal Coherence#Emotion-Driven Music2026년 2월 12일댓글 수 로딩 중