[논문리뷰] Towards Streaming Synchronized Spatial Audio Generation via Autoregressive Diffusion Transformer본 논문은 실시간 인터랙티브 환경에서 몰입형 경험을 제공하기 위한 고품질 공간 오디오 생성 모델의 지연 시간과 정확도 문제를 해결하고자 합니다.#Review#Spatial Audio Generation#Autoregressive Diffusion Transformer#Multimodal Learning#Streaming Generation#First-Order Ambisonics#Contrastive Learning#Direct Preference Optimization2026년 5월 31일댓글 수 로딩 중
[논문리뷰] LPM 1.0: Video-based Character Performance Model본 논문은 정체성 인식 다중 참조 추출과 오디오-비디오 페어링이 포함된 고품질 데이터셋을 구축하고, 이를 기반으로 Diffusion Transformer 모델을 학습시켰습니다. 모델은 Base LPM을 통해 정체성을 보존하며, 이를 Online LPM으로 증류하여 낮은 지연 시간 내에 무한한 길이의 스트리밍 영상을 생성합니다.#Review#Large Performance Model#Full-Duplex#Diffusion Transformer#Identity-Consistent#Real-Time Inference#Streaming Generation#LPM-Bench2026년 4월 9일댓글 수 로딩 중
[논문리뷰] Astrolabe: Steering Forward-Process Reinforcement Learning for Distilled Autoregressive Video ModelsDistilled autoregressive (AR) video models는 efficient streaming generation을 가능하게 하지만, 종종 human visual preferences와 misalign되어 artifacts나 unnatural motion dynamics를 보입니다.#Review#Video Generation#Distilled Autoregressive Models#Reinforcement Learning (RL)#Human Preferences#Streaming Generation#Forward-Process RL#Reward Hacking#Temporal Consistency2026년 3월 22일댓글 수 로딩 중
[논문리뷰] Causal Motion Diffusion Models for Autoregressive Motion Generation본 논문은 기존 모션 확산 모델의 인과성 부족과 자기회귀 모델의 불안정성 및 오류 누적 문제를 해결하여, 고품질의 시간적으로 순서가 보장되는(temporally ordered) 모션 생성을 목표로 합니다.#Review#Motion Generation#Diffusion Models#Autoregressive Models#Causal Modeling#Latent Space#Text-to-Motion#Human Motion Synthesis#Streaming Generation2026년 2월 26일댓글 수 로딩 중