본문으로 건너뛰기

#Multimodal Generation

15개의 포스트

[논문리뷰] JavisDiT++: Unified Modeling and Optimization for Joint Audio-Video Generation

댓글 수 로딩 중

[논문리뷰] Ex-Omni: Enabling 3D Facial Animation Generation for Omni-modal Large Language Models

댓글 수 로딩 중

[논문리뷰] TUNA: Taming Unified Visual Representations for Native Unified Multimodal Models

댓글 수 로딩 중

[논문리뷰] Uni-MoE-2.0-Omni: Scaling Language-Centric Omnimodal Large Model with Advanced MoE, Training and Data

댓글 수 로딩 중

[논문리뷰] Can Understanding and Generation Truly Benefit Together -- or Just Coexist?

댓글 수 로딩 중

[논문리뷰] MIDAS: Multimodal Interactive Digital-human Synthesis via Real-time Autoregressive Video Generation

댓글 수 로딩 중

[논문리뷰] EgoTwin: Dreaming Body and View in First Person

댓글 수 로딩 중

[논문리뷰] DialectGen: Benchmarking and Improving Dialect Robustness in Multimodal Generation

댓글 수 로딩 중

[논문리뷰] Discrete Diffusion Models with MLLMs for Unified Medical Multimodal Generation

댓글 수 로딩 중