[논문리뷰] DyaDiT: A Multi-Modal Diffusion Transformer for Socially Favorable Dyadic Gesture Generation기존 제스처 생성 모델이 단일 화자의 오디오에만 초점을 맞추고 사회적 맥락이나 두 화자 간의 상호작용 역학을 무시하여 비현실적이거나 부자연스러운 제스처를 생성하는 문제를 해결하고자 합니다.#Review#Gesture Generation#Diffusion Transformer (DiT)#Multi-Modal#Dyadic Interaction#Socially Aware AI#Orthogonalization Cross Attention#Motion Dictionary2026년 2월 26일댓글 수 로딩 중