[논문리뷰] Hierarchical Codec Diffusion for Video-to-Speech Generation본 논문은 기존 VTS 방법론들이 음성의 계층적 구조를 간과함으로써 시각 정보와 음성 특징 간의 효과적인 정렬에 한계를 보이는 문제를 해결하고자 한다.#Review#Video-to-Speech#Discrete Diffusion Models#Hierarchical Modeling#Audio-Visual Alignment#Residual Vector Quantization#Transformer2026년 4월 19일댓글 수 로딩 중
[논문리뷰] Unified Number-Free Text-to-Motion Generation Via Flow Matching기존의 Text-to-motion 모델들은 주로 단일 에이전트 생성에 국한되어 있으며, 다중 에이전트 생성의 경우 고정된 수의 에이전트만 처리할 수 있다는 한계가 있습니다.#Review#Text-to-Motion#Flow Matching#Number-Free Synthesis#Hierarchical Modeling#Multi-Person Interaction2026년 3월 30일댓글 수 로딩 중
[논문리뷰] Don't Waste It: Guiding Generative Recommenders with Structured Human Priors via Multi-head Decoding본 논문은 추천 시스템이 정확도를 넘어선 다양성, 참신성, 개인화 등의 목표를 달성하지 못하는 문제를 해결하고자 합니다.#Review#Generative Recommenders#Human Priors#Multi-head Decoding#Disentangled Representation Learning#Sequential Recommendation#Adapter Networks#Hierarchical Modeling2025년 11월 16일댓글 수 로딩 중