[논문리뷰] Native Audio-Visual Alignment for Generation본 논문은 오디오-비디오 조인트 생성 모델에서 발생하는 동기화 성능 저하와 모달리티 간 정보 결합 문제를 해결하는 것을 목표로 합니다.#Review#Audio-Visual Generation#Native Alignment#MMDiT#Timbre-in-Context Conditioning#Condition-Factorized Guidance2026년 5월 28일댓글 수 로딩 중