[논문리뷰] SketchDynamics: Exploring Free-Form Sketches for Dynamic Intent Expression in Animation Generation

수정: 2026년 1월 29일

링크: 논문 PDF로 바로 열기

저자: Boyu Li, Lin-Ping Yuan, Zeyu Wang, Hongbo Fu

핵심 연구 목표

본 논문은 기존 애니메이션 도구가 스케치를 고정된 명령으로 제한하여 자유로운 표현과 인간의 의도 반영에 한계가 있다는 문제를 해결합니다. 자유형 스케치를 통해 동적 의도(dynamic intent)를 효과적으로 포착하고, 이를 활용하여 애니메이션 콘텐츠를 자동으로 생성하는 인터랙션 패러다임을 탐구하는 것을 목표로 합니다.

핵심 방법론

제안하는 SketchDynamics 시스템은 사용자가 자유형 스케치 스토리보드를 통해 비전-언어 모델(VLM) 에 동적 의도를 전달하여 설명자 스타일의 모션 그래픽을 생성합니다. 이 과정은 세 단계로 구성됩니다: (1) 스케치 입력 및 직접 생성 시 사용자의 스케치를 VLM 이 해석하여 실행 가능한 Manim Python 코드 를 생성하고 동영상을 렌더링합니다. (2) 명확화 질문(clarification cues) 단계에서는 VLM 이 스케치의 모호성을 감지하면(예: 불확실한 스트로크, 다중 해석) 적응적으로 질문하여 사용자가 해석 과정에 개입할 수 있도록 합니다. (3) 반복적 정교화(iterative refinement) 단계에서는 생성된 동영상 프레임 위에 직접 스케치하거나 텍스트 프롬프트를 사용하여 원하는 부분을 수정하고, VLM 이 관련 코드만 업데이트하여 효율적인 수정을 가능하게 합니다.

주요 결과

1단계(초기 생성) 에서는 24개 시도 중 5개에서 실패했으나, 자유형 스케치의 잠재력과 모호성을 확인했습니다. 2단계(명확화) 에서는 24개 시도에서 총 87개의 명확화 질문 이 발생했으며, 참가자들은 이를 "도움이 되는 확인"으로 평가했고, 19개 시도에서 의도에 더 가까운 결과물을 얻었습니다. 3단계(정교화) 에서는 8명의 참가자가 55회의 정교화 작업 (36회 스케치 기반, 19회 텍스트 기반)을 통해 12개의 동영상 을 편집했습니다. 사용자 만족도 Likert 척도 에서 "일치도(Alignment)"와 "제어(Control)"가 1단계 대비 3단계에서 크게 향상되었고, "노력(Effort)"은 감소하여 시스템의 효율성과 사용자 제어감을 입증했습니다.

AI 실무자를 위한 시사점

본 연구는 VLM 이 자유형 스케치를 해석하여 동적 의도를 애니메이션으로 구현하는 가능성을 보여주며, 애니메이션 콘텐츠 생성 분야에서 VLM 의 활용 범위를 넓힙니다. 특히, 인간-AI 협업 을 통해 AI의 내재된 모호성을 해소하고 사용자의 의도를 점진적으로 구체화하는 반복적 워크플로 의 중요성을 강조합니다. 적응형 명확화(adaptive clarification)시각적 정교화(visual refinement) 메커니즘은 AI 시스템이 사용자 의도를 더 정확히 이해하고 최소한의 노력으로 고품질 결과물을 생성하도록 돕는 효과적인 디자인 패턴을 제시합니다.

⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.

태그

#Review#Animation Generation#Free-Form Sketching#Human-AI Interaction#Vision-Language Models (VLMs)#Dynamic Intent Expression#Motion Graphics#Iterative Refinement#Storyboard

Review 의 다른글