본문으로 건너뛰기

#Cross-Attention

15개의 포스트

[논문리뷰] Steerable Visual Representations

댓글 수 로딩 중

[논문리뷰] M-ErasureBench: A Comprehensive Multimodal Evaluation Benchmark for Concept Erasure in Diffusion Models

댓글 수 로딩 중

[논문리뷰] The World is Your Canvas: Painting Promptable Events with Reference Images, Trajectories, and Text

댓글 수 로딩 중

[논문리뷰] Pay Less Attention to Function Words for Free Robustness of Vision-Language Models

댓글 수 로딩 중

[논문리뷰] VLA-4D: Embedding 4D Awareness into Vision-Language-Action Models for SpatioTemporally Coherent Robotic Manipulation

댓글 수 로딩 중

[논문리뷰] Taming Generative Synthetic Data for X-ray Prohibited Item Detection

댓글 수 로딩 중

[논문리뷰] Lynx: Towards High-Fidelity Personalized Video Generation

댓글 수 로딩 중

[논문리뷰] C-DiffDet+: Fusing Global Scene Context with Generative Denoising for High-Fidelity Object Detection

댓글 수 로딩 중

[논문리뷰] Personalized Safety Alignment for Text-to-Image Diffusion Models

댓글 수 로딩 중