#Identity Preservation

15개의 포스트

[논문리뷰] StyleID: A Perception-Aware Dataset and Metric for Stylization-Agnostic Facial Identity Recognition

본 논문은 기존의 identity encoder들이 자연 사진(natural photograph)에 과적합되어 있어, 다양한 스타일로 변환된 인물 사진에서 identity preservation 성능이 심각하게 저하되는 문제를 해결하고자 한다.

#Review #Facial Identity Recognition #Face Stylization #Perception-Aware #Identity Preservation #Deep Learning #Human-Calibration

2026년 4월 23일

[논문리뷰] WildActor: Unconstrained Identity-Preserving Video Generation

본 논문은 기존 비디오 생성 모델이 동적인 움직임, 시점 변화에도 불구하고 일관된 전신(full-body) 신원(identity)을 유지 하는 데 실패하고, 얼굴 중심적 편향, 자세 고정(pose locking) 등의 문제를 겪는다는 점을 지적합니다.

#Review #Video Generation #Identity Preservation #Human-Centric Video #Large-scale Dataset #Diffusion Models #Attention Mechanism #Viewpoint Consistency

2026년 3월 8일

[논문리뷰] Kling-MotionControl Technical Report

논문은 드라이빙 비디오와 참조 이미지를 기반으로 사실적이고 제어 가능한 홀리스틱 캐릭터 애니메이션 비디오를 생성 하는 것을 목표로 합니다.

#Review #Character Animation #Video Generation #Diffusion Transformers (DiT)#Motion Control #Identity Preservation #Cross-Identity Transfer #Inference Acceleration #Multi-Granular Motion

2026년 3월 3일

[논문리뷰] Alterbute: Editing Intrinsic Attributes of Objects in Images

이미지 내 객체의 색상, 질감, 재질, 심지어 모양과 같은 내재적 속성(Intrinsic Attributes) 을 변경하면서도 객체의 인지된 정체성(Identity)과 장면 맥락을 충실히 보존하는 새로운 방법을 개발하는 것입니다.

#Review #Intrinsic Attributes #Object Editing #Diffusion Models #Identity Preservation #Visual Named Entities #Text-to-Image #VLM

2026년 1월 15일

[논문리뷰] DreamID-V:Bridging the Image-to-Video Gap for High-Fidelity Face Swapping via Diffusion Transformer

비디오 얼굴 스와핑(VFS)에서 기존 이미지 얼굴 스와핑(IFS) 모델 대비 신원 유사성 및 속성 보존 능력의 격차를 해소하고, 시간적 일관성 문제를 해결하는 것이 주된 목표입니다.

#Review #Video Face Swapping #Diffusion Transformer #Identity Preservation #Temporal Consistency #Modality-Aware Conditioning #Reinforcement Learning #Data Synthesis

2026년 1월 5일

[논문리뷰] FlashPortrait: 6x Faster Infinite Portrait Animation with Adaptive Latent Prediction

본 논문은 확산 모델 기반의 기존 장시간 인물 애니메이션 방법론이 겪는 신원(ID) 불일치 및 높은 추론 지연 시간 문제를 해결하고자 합니다. 특히, ID를 보존 하면서 무한 길이의 비디오 를 생성하고, 추론 속도를 최대 6배까지 가속 하는 것을 목표로 합니다.

#Review #Portrait Animation #Diffusion Models #Inference Acceleration #Identity Preservation #Video Generation #Latent Prediction #Sliding Window

2025년 12월 18일

[논문리뷰] DeContext as Defense: Safe Image Editing in Diffusion Transformers

본 논문은 대규모 Diffusion Transformer(DiT) 기반 이미지 편집 모델 의 심각한 프라이버시 문제를 해결하고자 합니다.

#Review #Diffusion Transformers #Image Editing #Privacy Protection #Adversarial Attack #Attention Mechanism #Identity Preservation #Deepfake Defense #In-context Learning

2025년 12월 18일

[논문리뷰] Scaling Zero-Shot Reference-to-Video Generation

논문은 기존 R2V(Reference-to-Video) 생성 모델이 명시적인 R2V 데이터셋 에 의존하여 확장성과 일반화 능력이 제한되는 문제를 해결하고자 합니다. 이를 위해 명시적인 R2V 데이터 없이 순수한 대규모 비디오-텍스트 쌍 만을 사용하여 제로샷 R2V 생성 이 가능한 Saber 프레임워크를 제안합니다.

#Review #Reference-to-Video Generation #Zero-Shot Learning #Diffusion Models #Masked Training #Video-Text Pairs #Identity Preservation #Scalability #Attention Mechanism

2025년 12월 8일

[논문리뷰] Lynx: Towards High-Fidelity Personalized Video Generation

본 논문은 단일 입력 이미지로부터 고품질의 개인화된 비디오를 합성 하는 모델인 Lynx를 제시하며, 특히 높은 신원 보존 을 목표로 합니다. 기존 비디오 생성 모델의 한계인 대상의 신원 불일치 문제를 해결하고, 시간적 일관성과 시각적 사실성을 유지하는 비디오 생성을 목표로 합니다.

#Review #Personalized Video Generation #Diffusion Transformer #Identity Preservation #Video Synthesis #Adapter Networks #Facial Recognition #Cross-Attention

2025년 9월 22일

[논문리뷰] LazyDrag: Enabling Stable Drag-Based Editing on Multi-Modal Diffusion Transformers via Explicit Correspondence

본 논문은 드래그 기반 이미지 편집에서 Multi-Modal Diffusion Transformers (MM-DiTs) 의 불안정성을 해결하고, 기존 방식의 암묵적 점 매칭 및 Test-Time Optimization (TTO) 또는 약화된 인버전 강도 의존성으로 인한 한계를 극복하는 것을 목표로 합니다.

#Review #Image Editing #Diffusion Models #Multi-Modal Transformers #Drag-based Editing #Explicit Correspondence #Attention Control #Identity Preservation #Training-Free

2025년 9월 16일

[논문리뷰] MOSAIC: Multi-Subject Personalized Generation via Correspondence-Aware Alignment and Disentanglement

이 논문은 다중 피사체 개인화 이미지 생성 시 발생하는 정체성 혼합(identity blending) 및 속성 유출(attribute leakage) 문제를 해결하는 것을 목표로 합니다.

#Review #Multi-Subject Generation #Personalized Image Synthesis #Semantic Correspondence #Attention Disentanglement #Diffusion Models #Identity Preservation #Dataset

2025년 9월 4일

[논문리뷰] Stand-In: A Lightweight and Plug-and-Play Identity Control for Video Generation

이 논문은 비디오 생성에서 사용자가 지정한 정체성을 고품질로 일관되게 유지하면서도, 기존 방법론의 과도한 훈련 파라미터 및 다른 AI 생성 모델과의 호환성 부족 문제를 해결하는 것을 목표로 합니다. 특히, 경량의 플러그-앤-플레이 프레임워크를 통해 실용적인 정체성 제어 솔루션을 제시하고자 합니다.

#Review #Video Generation #Identity Preservation #Plug-and-Play #Diffusion Models #Self-Attention #Lightweight AI #Conditional Image Branch

2025년 8월 14일

[논문리뷰] Track, Inpaint, Resplat: Subject-driven 3D and 4D Generation with Progressive Texture Infilling

기존 3D/4D 생성 모델들은 주로 사실성, 효율성, 미학에 초점을 맞추어 개발되었으나, 다양한 시점에서 대상의 의미론적 정체성(semantic identity)을 보존 하는 데 한계를 보였습니다.

#Review #Subject-driven 3D/4D Generation #Texture Infilling #Video Tracking #Image Inpainting #Multi-view Consistency #Identity Preservation #Generative Models #3D Gaussians

2025년 10월 28일

[논문리뷰] Lookahead Anchoring: Preserving Character Identity in Audio-Driven Human Animation

오디오 기반 인물 애니메이션 모델이 장시간 생성 시 겪는 캐릭터 정체성(identity) 표류 문제를 해결하고, 기존 키프레임 기반 방법론의 한계를 극복하여 일관된 캐릭터 정체성 과 높은 시각적 품질 을 유지하는 것을 목표로 합니다.

#Review #Audio-driven Animation #Identity Preservation #Diffusion Transformers #Long-form Video Generation #Temporal Autoregression #Keyframe Anchoring #Self-keyframing

2025년 10월 28일

[논문리뷰] Character Mixing for Video Generation

이 논문은 비디오 생성에서 비공존 캐릭터 간의 자연스러운 상호작용 을 가능하게 하는 것을 목표로 합니다.

#Review #Video Generation #Character Mixing #Style Preservation #Multi-character Interaction #Text-to-Video #Cross-Domain Synthesis #Identity Preservation

2025년 10월 7일