본문으로 건너뛰기

#Controllable Generation

17개의 포스트

[논문리뷰] Interpreting and Steering a Text-to-Speech Language Model with Sparse Autoencoders

댓글 수 로딩 중

[논문리뷰] GenClaw: Code-Driven Agentic Image Generation

댓글 수 로딩 중

[논문리뷰] CogOmniControl: Reasoning-Driven Controllable Video Generation via Creative Intent Cognition

댓글 수 로딩 중

[논문리뷰] Diffusion Templates: A Unified Plugin Framework for Controllable Diffusion

댓글 수 로딩 중

[논문리뷰] Lighting-grounded Video Generation with Renderer-based Agent Reasoning

댓글 수 로딩 중

[논문리뷰] Gated Condition Injection without Multimodal Attention: Towards Controllable Linear-Attention Transformers

댓글 수 로딩 중

[논문리뷰] DreamID-Omni: Unified Framework for Controllable Human-Centric Audio-Video Generation

댓글 수 로딩 중

[논문리뷰] Reasoning Palette: Modulating Reasoning via Latent Contextualization for Controllable Exploration for (V)LMs

댓글 수 로딩 중

[논문리뷰] Hunyuan3D-Omni: A Unified Framework for Controllable Generation of 3D Assets

댓글 수 로딩 중

[논문리뷰] PhysCtrl: Generative Physics for Controllable and Physics-Grounded Video Generation

댓글 수 로딩 중

[논문리뷰] Mixture of Global and Local Experts with Diffusion Transformer for Controllable Face Generation

댓글 수 로딩 중

[논문리뷰] WithAnyone: Towards Controllable and ID Consistent Image Generation

댓글 수 로딩 중

[논문리뷰] Video-As-Prompt: Unified Semantic Control for Video Generation

댓글 수 로딩 중