본문으로 건너뛰기

[논문리뷰] Dr-DCI: Scaling Direct Corpus Interaction via Dynamic Workspace Expansion

링크: 논문 PDF로 바로 열기

메타데이터

저자: Yi Lu, Zhuofeng Li, Ping Nie, Haoxiang Zhang, Yuyu Zhang, Kai Zou, Wenhu Chen, Jimmy Lin, Dongfu Jiang, Yu Zhang et al.


1. Key Terms & Definitions (핵심 용어 및 정의)

  • Direct Corpus Interaction (DCI): LLM 에이전트가 리트리버를 거치지 않고 터미널 명령어(예: rg, grep, find, read)를 사용하여 코퍼스에 직접 접근하고 조작하는 방식입니다.
  • Dynamic Workspace Expansion: 에이전트가 필요한 시점에 pull 명령어를 호출하여 관련 문서를 로컬 워크스페이스로 동적으로 불러와 작업을 수행하는 방법론입니다.
  • Pull Interface: 에이전트가 쿼리와 예산(topK)을 지정하여 전체 코퍼스에서 유망한 후보군을 선택하고 이를 현재 워크스페이스에 구체화(Materialize)하는 에이전트 호출 가능한 액션입니다.
  • Workspace-Preserving Context Reset: 추론 과정에서 에이전트의 신뢰도가 낮을 때, 기존의 실패한 reasoning trace는 삭제하되 이미 구축된 워크스페이스 상태는 유지하여 새로운 관점에서 문제를 해결하도록 유도하는 복구 메커니즘입니다.

2. Motivation & Problem Statement (연구 배경 및 문제 정의)

본 논문은 대규모 코퍼스에서 에이전트 기반 검색(Agentic Search)의 확장성과 정밀도 사이의 상충 문제를 해결하고자 합니다. 기존의 RAG(Retrieval-Augmented Generation) 시스템은 리트리버가 제공하는 고정된 문서 목록에 의존하여 에이전트의 유연한 증거 비교 및 재구성을 제한하며, 반대로 Raw-DCI는 코퍼스 전체에 대해 터미널 명령어를 직접 실행하므로 코퍼스 규모가 커질수록 연산이 느려지고 불안정해집니다 [Figure 1]. 따라서 저자들은 리트리버의 확장성과 DCI의 정밀한 조작 능력을 결합한 새로운 프레임워크가 필요하다고 판단하였습니다.

Figure 1: DR-DCI 전체 아키텍처

Figure 1 — DR-DCI 전체 아키텍처

3. Method & Key Results (제안 방법론 및 핵심 결과)

본 논문은 리트리버를 에이전트가 호출 가능한 워크스페이스 확장 도구로 재정의한 DR-DCI를 제안합니다. 에이전트는 pull 도구를 통해 코퍼스에서 필요한 문서를 동적으로 로컬 워크스페이스로 가져오며, 이후 이 제한된 범위 내에서 DCI 명령어를 사용하여 효율적으로 증거를 검증하고 필터링합니다 [Figure 1]. BrowseComp-Plus 벤치마크 평가 결과, DR-DCI는 기존 Raw-DCI 대비 정확도를 8.3%p 향상(62.9% → 71.2%)시켰으며, 도구 사용량, 벽시계 시간(wall time), 추정 비용을 모두 절감하는 우수한 성능을 보였습니다 [Table 1]. 추가적으로 Workspace-Preserving Context Reset을 적용할 경우 정확도가 73.3%까지 상승하였습니다 [Table 1]. 코퍼스 규모를 10만에서 1,000만 문서로 확장하는 실험에서 DR-DCI는 안정적인 성능을 유지했으나, Raw-DCI는 명령어 타임아웃 등으로 인해 연산 불능 상태에 빠지는 한계를 보였습니다 [Figure 3].

Figure 3: 코퍼스 규모별 성능 비교

Figure 3 — 코퍼스 규모별 성능 비교

4. Conclusion & Impact (결론 및 시사점)

본 연구는 대규모 코퍼스 환경에서 에이전트가 리트리버를 단순한 증거 제공자가 아닌 워크스페이스 관리 도구로 활용할 때 검색 효율성과 정확도가 크게 향상됨을 입증했습니다. DR-DCI는 검색과 로컬 조작을 계층화하여 기존 DCI가 가진 확장성 문제를 성공적으로 극복했습니다. 이 연구는 향후 복잡한 장기 추론 에이전트(Long-horizon Search Agents) 설계 시, 에이전트와 환경 간의 인터페이스 최적화가 필수적임을 시사하며, 대규모 데이터셋 처리 분야에서 실질적인 가이드라인을 제시합니다.

⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.

댓글

관련 포스트

Review 의 다른글