[논문리뷰] A Survey on LLM-based Conversational User Simulation

2026년 4월 29일수정: 2026년 4월 29일

링크: 논문 PDF로 바로 열기

저자: Bo Ni, Leyao Wang, Yu Wang, Branislav Kveton, Franck Dernoncourt, et al.

1. Key Terms & Definitions (핵심 용어 및 정의)

Conversational User Simulation: 인간과 AI 간 혹은 AI 간의 상호작용을 모사하여 대화 데이터를 생성하거나 시스템을 평가하는 기술적 과정.
Persona-level User Simulation: 사용자 프로필(인구 통계, 관심사 등)을 명시적으로 정의하여 해당 속성을 가진 사용자의 발화 스타일과 행동을 모사하는 방식.
Role Play Simulation: 특정 인물(실존 혹은 허구)의 성격과 이력을 바탕으로 LLM의 내재적 지식을 활용하여 고도로 맞춤화된 사용자 행동을 모사하는 방식.
LLM-as-a-Judge: 사전 학습된 강력한 LLM을 평가자(Judge)로 활용하여, 생성된 대화의 일관성, 유창성, 사실성 등을 자동으로 정량 평가하는 방법론.
Hybrid Simulation: Prompting, RAG, Fine-tuning, RL 등 다양한 방법론을 복합적으로 사용하여 시뮬레이션의 현실성(Fidelity)과 제어 가능성을 극대화하는 프레임워크.

2. Motivation & Problem Statement (연구 배경 및 문제 정의)

본 논문은 LLM의 발달로 가능해진 사용자 시뮬레이션 기술의 체계적인 분류와 분석이 부재한 문제를 해결하고자 한다. 기존의 사용자 시뮬레이션은 특정 도메인(예: 추천 시스템)에 한정되거나 대규모 데이터 수집의 어려움으로 인해 확장성에 한계가 있었다. LLM 기반의 시뮬레이션은 이러한 장벽을 낮추었으나, 대화의 상호작용성과 사용자 의도의 다양성을 효과적으로 모사하기 위한 통합된 연구 프레임워크가 필요하다. 저자들은 이 연구를 통해 시뮬레이션 대상을 정의하고, 연구 동향을 'Who', 'What', 'How'라는 3가지 핵심 축으로 정리하여 연구 커뮤니티에 가이드라인을 제공한다 [Figure 1].

Figure 1: 시뮬레이션 택소노미 개요

Figure 1 — 시뮬레이션 택소노미 개요

3. Method & Key Results (제안 방법론 및 핵심 결과)

본 논문은 Conversational User Simulation을 위한 통합된 택소노미(Taxonomy)를 제안한다. 'Who' 섹션은 시뮬레이션 대상을 일반 사용자부터 특정 페르소나, 역할 연기(Role Play), 개별 사용자 시뮬레이션으로 세분화하며, 각 레벨에서의 최신 기법을 분석한다 [Figure 2]. 'What' 섹션은 Human-AI, Human-Human, AI-AI, Many-Human-AI 등 상호작용 패턴에 따른 목표 설정을 체계화한다. 'How' 섹션은 Prompt-based 기법, RAG, Fine-tuning, RL/DPO 등을 포함한 기술적 구현 전략을 다룬다 [Table 1]. 주요 결과로서, Fine-tuning 기반 기법이 Prompting 기법보다 특정 캐릭터의 지식(SPE) 및 일관성 측면에서 성능 우위를 점하는 경우가 많음을 확인하였다. 또한, LLM-as-a-Judge가 인간 평가의 비용 문제를 해결하는 효과적인 대안으로 부상하고 있으나, 편향성(Bias) 문제와 프롬프트 민감도 문제를 안고 있음을 정량적 연구 결과를 통해 시사한다.

Figure 2: 시뮬레이션 대상 분류

Figure 2 — 시뮬레이션 대상 분류

Table 1: 기법 및 응용 분야 비교

Table 1 — 기법 및 응용 분야 비교

4. Conclusion & Impact (결론 및 시사점)

본 논문은 LLM 기반 Conversational User Simulation에 대한 체계적인 분류를 통해 향후 연구 방향성을 제시한다. 대규모 언어 모델의 발전으로 사용자 시뮬레이션은 데이터 생성, 시스템 평가, 인간 행동 이해 등 다양한 응용 분야에서 핵심적인 역할을 수행하게 되었다. 이 연구는 시뮬레이터의 신뢰성(Trustworthiness)과 다양성(Diversity) 확보가 향후 기술 발전의 핵심 과제임을 강조한다. 학계 및 산업계는 제안된 통합 프레임워크를 바탕으로 보다 일관성 있고 윤리적인 가이드라인을 갖춘 시뮬레이션 시스템을 구축할 수 있을 것이다.

⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.

Review 의 다른글

이전글 [논문리뷰] GoClick: Lightweight Element Grounding Model for Autonomous GUI Interaction
현재글 : [논문리뷰] A Survey on LLM-based Conversational User Simulation
다음글 [논문리뷰] Diffusion Templates: A Unified Plugin Framework for Controllable Diffusion