[논문리뷰] DrawMotion: Generating 3D Human Motions by Freehand Drawing

2026년 5월 20일수정: 2026년 5월 20일

링크: 논문 PDF로 바로 열기

메타데이터

저자: Tao Wang, Lei Jin, Zhihua Wu, Qiaozhi He, Jiaming Chu, Yu Cheng, Junliang Xing, Jian Zhao, Shuicheng Yan, Li Wang

## 1. Key Terms & Definitions (핵심 용어 및 정의)

MCM (Multi-Condition Module): 텍스트 및 핸드 드로잉(stickman, trajectory) 등 여러 조건을 효율적으로 융합하기 위해 설계된 모듈로, 기존의 마스크 기반 접근법보다 계산 복잡도를 낮추고 성능을 향상함.
IFG (Intermediate Feature Guidance): MCM의 중간 특징(intermediate feature) 공간이 연속적이라는 점을 활용하여, 추가적인 재학습 없이 추론 시점에 공간적 제약 조건을 반영하는 학습이 필요 없는 가이던스 전략.
SGA (Stickman Generation Algorithm): 3D 모션 데이터셋에서 2D 스틱맨 스케치를 자동으로 생성하여, 데이터 부족 문제를 해결하고 사용자 경험을 개선하는 알고리즘.
StiSim (Stickman Similarity): 생성된 모션 시퀀스와 사용자 제공 스틱맨 조건 사이의 일치도를 측정하는 지표.
MD Clipping (Mahalanobis Distance Clipping): 가이던스 과정에서 모델의 특징 벡터가 학습된 데이터 분포를 벗어나지 않도록 Mahalanobis Distance를 활용하여 제어하는 기법.

## 2. Motivation & Problem Statement (연구 배경 및 문제 정의) 본 논문은 텍스트 기술만으로는 사용자가 의도한 복잡하고 세밀한 3D 모션을 정밀하게 제어하기 어렵다는 점을 해결하고자 합니다. 기존 연구들은 복잡한 텍스트 묘사에 의존하거나, 추가적인 모델링을 통해 모션을 수정하지만 이는 사용자에게 상당한 시간적 비용과 입력 부담을 초래합니다. 또한, 기존 방법론들은 여러 제약 조건(텍스트와 공간적 스케치 등)을 동시에 처리할 때 계산적 비효율성을 야기하거나, 공간적 가이던스 시 모션의 일관성을 저해하는 문제가 발생합니다. 이를 위해 본 연구에서는 핸드 드로잉을 통한 직관적인 공간 제어와 효율적인 멀티 조건 융합 프레임워크인 DrawMotion을 제안합니다.

## 3. Method & Key Results (제안 방법론 및 핵심 결과) DrawMotion은 사용자가 제공한 2D 스틱맨과 궤적(trajectory) 정보를 바탕으로 3D 모션을 생성하며, MCM을 통해 텍스트와 드로잉 조건을 병합하여 복잡도를 줄이고 IFG를 도입하여 추론 시 정밀한 정렬을 수행합니다. 특히 MCM의 출력 특징 공간은 기존 모델들의 불연속적인 특징 분포와 달리 밀집되고 연속적인 구조를 띄고 있어, Gradient 기반의 업데이트를 안정적으로 수용할 수 있습니다. 실험 결과, 본 제안 방법론은 HumanML3D 및 KIT-ML 데이터셋에서 기존 방법론 대비 우수한 성능을 입증하였습니다. 정량적으로 DrawMotion은 기존 SOTA 방식 대비 뛰어난 StiSim 수치를 기록하였으며, Traj.Err. 지표에서 현저히 낮은 오류율을 보였습니다. 또한, 사용자 스터디를 통해 수동 애니메이션 제작 대비 작업 시간을 약 46.7% 단축하면서도 사용자 만족도는 최고 수준인 9.5점을 기록했습니다. 이는 [Table III]와 [Table IV]에 명시된 주요 성능 지표들을 통해 확인할 수 있습니다.

Table III: HumanML3D 데이터셋에서의 SOTA 성능 비교 결과

Table III — HumanML3D 데이터셋에서의 SOTA 성능 비교 결과

Table IV: KIT-ML 데이터셋에서의 SOTA 성능 비교 결과

Table IV — KIT-ML 데이터셋에서의 SOTA 성능 비교 결과

## 4. Conclusion & Impact (결론 및 시사점) 본 논문은 직관적인 핸드 드로잉 조건을 인간 모션 생성에 도입하여 제어 가능성과 효율성을 극대화한 DrawMotion을 제안합니다. 제안된 MCM과 IFG 전략은 학습된 분포 내에서 정밀한 모션 조정을 가능하게 함으로써, 추가적인 파라미터 업데이트 없이도 높은 모션 충실도를 유지합니다. 이러한 기술적 진보는 향후 게임, 영화, VR 산업에서 애니메이터들의 작업 효율을 크게 개선할 수 있는 핵심적인 인터랙티브 모션 생성 베이스라인으로 자리매김할 것으로 기대됩니다.

Figure 3: DrawMotion의 전체 아키텍처와 확산 과정을 보여주는 핵심 다이어그램

Figure 3 — DrawMotion의 전체 아키텍처와 확산 과정을 보여주는 핵심 다이어그램

⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.

Review 의 다른글

이전글 [논문리뷰] CutVerse: A Compositional GUI Agents Benchmark for Media Post-Production Editing
현재글 : [논문리뷰] DrawMotion: Generating 3D Human Motions by Freehand Drawing
다음글 [논문리뷰] Enhancing Train-Free Infinite-Frame Generation for Consistent Long Videos

[논문리뷰] DrawMotion: Generating 3D Human Motions by Freehand Drawing

메타데이터

댓글

관련 포스트

Review 의 다른글