[논문리뷰] Story2Proposal: A Scaffold for Structured Scientific Paper Writing

2026년 3월 30일수정: 2026년 3월 30일

링크: 논문 PDF로 바로 열기

Part 1: 요약 본문

메타데이터

저자: Zhuoyang Qian, Wei Shi, Xu Lin, Li Ling, Meng Luo, et al.

1. Key Terms & Definitions (핵심 용어 및 정의)

Shared Visual Contract : 논문의 구조, 시각적 요소(Figure/Table), 참조(Reference) 관계 등 핵심적인 구조적·시각적 제약을 관리하는 지속 가능한(persistent) 상태 제어 시스템입니다.
Generate–Evaluate–Adapt Loop : 생성 단계마다 평가 에이전트가 개입하여 추론 품질과 데이터 충실도를 검사하고, 그 피드백을 통해 다시 Contract를 업데이트하여 다음 생성 단계에 반영하는 폐루프 프로세스입니다.
Architect Agent : 연구 스토리를 바탕으로 논문의 청사진(Blueprint)을 작성하고 Contract를 초기화하는 역할을 수행합니다.
Renderer Agent : 최종적으로 논문을 LaTeX 형식으로 변환하며, 모든 수치와 참조가 Contract의 검증 규칙을 준수하는지 최종 확인하는 결정론적(deterministic) 컴포넌트입니다.

2. Motivation & Problem Statement (연구 배경 및 문제 정의)

현재의 대규모 언어 모델 기반 논문 생성 파이프라인은 주로 Unconstrained text synthesis 방식에 의존하고 있어, 생성 과정에서 구조적 표류(Structural drift)나 시각적 요소의 누락, 섹션 간 불일치와 같은 심각한 문제가 발생합니다. 논문 전체의 일관성을 유지하기 위해 필요한 상호 참조나 claim-evidence 간의 정렬이 파이프라인 내에서 명확하게 관리되지 않기 때문입니다. 이를 해결하기 위해 논문 작성 전체 과정에서 구조적 및 시각적 의무 사항을 명시적으로 관리하고 강제할 수 있는 체계적인 프레임워크가 필요합니다 [Figure 1].

Figure 1: Story2Proposal 전체 아키텍처

Figure 1 — Story2Proposal 전체 아키텍처

3. Method & Key Results (제안 방법론 및 핵심 결과)

본 연구에서 제안하는 Story2Proposal 은 연구 스토리를 구조화된 논문으로 변환하는 계약 기반(Contract-governed) 다중 에이전트 프레임워크입니다. Architect , Writer , Refiner , Renderer 로 구성된 4개의 전문 에이전트가 공유된 Shared Visual Contract 를 통해 협업하며, 각 생성 단계에서 평가 에이전트가 개입하여 Contract를 동적으로 업데이트하는 Generate–Evaluate–Adapt 메커니즘을 적용합니다 [Figure 2].

Figure 2: 공유 시각 계약 스키마

Figure 2 — 공유 시각 계약 스키마

실험 결과, Story2Proposal 은 DirectChat 대비 모든 LLM 백본(GPT, Claude, Gemini, Qwen)에서 압도적인 성능 우위를 보였습니다. 특히, 전문가 평가 지표(Expert evaluation score) 기준으로 DirectChat 의 평균 3.963점 대비 6.145점 을 기록하며 +2.182 의 유의미한 성능 향상을 달성했습니다 [Table 1]. 또한, 기존 구조화 생성 베이스라인인 Fars 와 비교했을 때도 평균 5.705점(Fars 5.197점)을 기록하여 구조적 일관성과 시각적 정렬 측면에서 더 높은 견고함을 입증했습니다. 특히, 시각적 요소와 서술 내용의 일관성 유지 측면에서 전문가들로부터 우수한 평가를 받았습니다 [Figure 3], [Figure 4].

Figure 3: 전문가 평가 프로토콜

Figure 3 — 전문가 평가 프로토콜

4. Conclusion & Impact (결론 및 시사점)

Story2Proposal 은 과학적 논문 생성을 단순한 텍스트 생성이 아닌, 계약에 의해 규율되는 구조적 건설 과정으로 재정의하였습니다. 이 연구는 구조적 제약과 지속적인 평가 피드백이 자동화된 시스템의 신뢰도를 얼마나 크게 높일 수 있는지 증명했습니다. 본 프레임워크는 연구자의 생산성을 극대화할 뿐만 아니라, AI가 복잡하고 긴 호흡의 전문적인 학술 콘텐츠를 생성할 때 발생하는 오류를 최소화하는 표준적인 모델로서 학계 및 산업계에 기여할 것으로 기대됩니다.

⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.

Review 의 다른글

이전글 [논문리뷰] SEAR: Schema-Based Evaluation and Routing for LLM Gateways
현재글 : [논문리뷰] Story2Proposal: A Scaffold for Structured Scientific Paper Writing
다음글 [논문리뷰] Superintelligence and Law