[논문리뷰] Investigating Autonomous Agent Contributions in the Wild: Activity Patterns and Code Change over Time

2026년 4월 2일수정: 2026년 4월 2일

링크: 논문 PDF로 바로 열기

Part 1: 요약 본문

메타데이터

저자: Razvan Mihai Popescu, David Gros, Andrei Botocan, Rahul Pandita, Prem Devanbu, Maliheh Izadi

1. Key Terms & Definitions (핵심 용어 및 정의)

Autonomous Coding Agents : 인간의 개입 없이 코드 생성, 브랜치 생성, Pull Request(PR) 제출, 코드 리뷰 등의 다단계 개발 워크플로우를 자율적으로 수행하는 AI 시스템을 지칭합니다.
Code Churn : 특정 기간 동안 코드 라인이 추가되거나 수정된 비율로, 코드의 변동성과 재작업 정도를 나타내며 소프트웨어 유지보수성과 안정성을 평가하는 지표입니다.
Survival Rate : 초기 커밋에 포함된 코드 라인이 일정 기간 동안 수정되거나 삭제되지 않고 유지되는 비율을 의미하며, 기여된 코드의 안정성을 측정합니다.
Pull Request (PR) : 개발자가 제안한 코드 변경 사항을 기존 코드베이스에 통합하기 위해 오픈하는 협업 단위로, 본 논문에서는 에이전트와 인간의 기여를 비교하는 주요 분석 대상입니다.

2. Motivation & Problem Statement (연구 배경 및 문제 정의)

본 논문은 급증하는 Autonomous Coding Agents 가 오픈소스 소프트웨어 생태계에 미치는 실질적인 영향과 그 결과물인 코드의 품질을 실증적으로 분석하는 것을 목표로 합니다. 기존 연구들은 주로 통제된 환경에서의 성능 평가나 소수의 인기 저장소에 국한되어, 실제 현업에서의 광범위한 기여 패턴과 유지보수 단계에서의 장기적 영향을 제대로 포착하지 못했다는 한계가 있습니다. 특히, 에이전트 생성 코드가 시간이 지남에 따라 어떻게 수정되거나 유지되는지에 대한 종단적(Longitudinal) 데이터가 부족한 상황입니다. 이러한 배경 하에 저자들은 11만 개 이상의 PR을 포함하는 대규모 데이터셋을 구축하여 에이전트와 인간 기여의 차이점을 규명하고자 합니다 [Figure 1].

Figure 1: 데이터셋 구조 개요

Figure 1 — 데이터셋 구조 개요

3. Method & Key Results (제안 방법론 및 핵심 결과)

저자들은 OpenAI Codex , Claude Code , GitHub Copilot , Google Jules , Devin 등 5가지 주요 에이전트와 인간 개발자가 생성한 111,969개의 PR 데이터를 수집하여 활동 패턴과 코드 진화 과정을 분석했습니다. 에이전트 기반 활동은 특히 0-star 저장소에서 매우 활발하게 나타나며, 인간 PR 대비 더 큰 규모의 변경과 추가 중심적인 코드 기여를 보이는 경향이 있습니다 [Figure 3]. Merge Time 분석 결과, Codex 와 같은 에이전트는 인간보다 훨씬 빠르게 PR이 병합되는 특징을 보이며, 이는 로트(rote) 작업 수행 혹은 사전 검토 프로세스의 존재 가능성을 시사합니다 [Figure 6]. 코드 진화 분석에서는 에이전트 생성 코드가 인간이 작성한 코드보다 Survival Rate 가 낮고 Churn Rate 가 높게 나타나, 초기 통합 이후 더 많은 재작업이 필요하다는 점을 확인했습니다 [Figure 8, Figure 9]. 이러한 결과는 에이전트 도입이 개발 속도를 높일 수 있으나, 코드의 장기적 유지보수성 측면에서는 추가적인 고려가 필요함을 정량적으로 입증합니다.

Figure 3: 에이전트별 PR 변경 규모

Figure 3 — 에이전트별 PR 변경 규모

4. Conclusion & Impact (결론 및 시사점)

본 연구는 자율형 코딩 에이전트가 소프트웨어 개발 생태계에 미치는 즉각적이고 종단적인 영향을 실증적으로 증명했습니다. 분석 결과, 에이전트 기여는 오픈소스 프로젝트, 특히 소규모 저장소에서 매우 빠르게 증가하고 있으나, 생성된 코드의 낮은 지속성과 높은 변동성은 향후 유지보수 비용을 증가시킬 잠재적 요인임을 시사합니다. 이 연구는 산업계와 학계에 에이전트 도입의 실질적인 비용과 혜택을 평가할 수 있는 중요한 기준을 제공하며, 향후 자동화된 소프트웨어 공학 도구의 설계 방향성에 중요한 통찰을 제시합니다.

Figure 8: 코드 라인 생존율 비교

Figure 8 — 코드 라인 생존율 비교

⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.

Review 의 다른글

이전글 [논문리뷰] Generative World Renderer
현재글 : [논문리뷰] Investigating Autonomous Agent Contributions in the Wild: Activity Patterns and Code Change over Time
다음글 [논문리뷰] LatentUM: Unleashing the Potential of Interleaved Cross-Modal Reasoning via a Latent-Space Unified Model