[논문리뷰] GraphLocator: Graph-guided Causal Reasoning for Issue Localization

수정: 2025년 12월 31일

링크: 논문 PDF로 바로 열기

저자: WEI LIU, CHAO PENG, PENGFEI GAO, AOFAN LIU, WEI ZHANG, HAIYAN ZHAO, ZHI JIN

핵심 연구 목표

본 논문은 소프트웨어 이슈 로컬라이제이션의 근본적인 문제인 '증상-원인 불일치(symptom-to-cause mismatch)'와 '일대다 불일치(one-to-many mismatch)'를 해결하는 것을 목표로 합니다. 자연어 이슈 설명과 실제 소스 코드 구현 사이의 의미론적 간극을 메우기 위해 인과 구조 발견 및 동적 이슈 분리(dynamic issue disentangling)를 통한 LLM 기반 접근 방식을 제안합니다.

핵심 방법론

GRAPHLOCATOR는 Causal Issue Graph (CIG) 를 핵심 아티팩트로 활용하여 인과적 추론을 수행합니다. CIG는 발견된 하위 이슈와 관련 코드 엔티티를 정점(vertex)으로, 이들 간의 인과적 의존성을 엣지(edge)로 인코딩한 방향성 그래프입니다. 프로세스는 symptom vertices locating (Agentic workflow를 통해 Repository Dependency Fractal Structure (RDFS) 에서 증상 위치 식별) 및 dynamic CIG discovering (인접 RDFS 정점을 반복적으로 추론하여 새로운 하위 이슈를 발견하고 CIG를 동적으로 확장)의 두 단계로 구성됩니다. 이 과정에서 그래프 기반 귀납적 추론(graph-guided abductive reasoning)우선순위 기반 그래프 확장(priority-driven graph expansion) 이 사용됩니다.

주요 결과

GRAPHLOCATOR는 Python (SWE-bench Lite, LocBench)Java (Multi-SWE-bench) 세 가지 실제 데이터셋에서 기존 baseline 대비 우수한 성능을 입증했습니다. 평균적으로 함수 레벨 재현율(recall)에서 19.49%p정확도(precision)에서 11.89%p 의 개선을 달성했습니다. 특히, 증상-원인 불일치일대다 불일치 시나리오에서 각각 재현율 16.44%p, 19.18%p 및 정확도 7.78%p, 13.23%p 향상을 보였습니다. GRAPHLOCATOR가 생성한 분리된 CIG 구조 는 downstream 이슈 해결 태스크에서 28.74%의 성능 향상 을 가져왔습니다.

AI 실무자를 위한 시사점

본 연구는 코드 이슈 로컬라이제이션에서 인과적 추론의 중요성 을 강조하며, LLM 기반 시스템의 정확성과 해석 가능성을 크게 향상시킬 수 있는 실용적인 방법을 제시합니다. AI/ML 엔지니어는 GRAPHLOCATOR의 그래프 기반 접근 방식 을 활용하여 소프트웨어 결함 분석 및 유지보수 작업을 자동화하고, 복잡한 시스템의 숨겨진 인과 관계를 파악하는 데 도움을 받을 수 있습니다. 특히, 세분화된 함수 레벨 에서의 강력한 성능은 실제 개발 환경에서 정밀한 코드 변경 지점 식별에 유용할 것입니다.

⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.

태그

#Review#Issue Localization#Causal Reasoning#Graph-guided#Large Language Models#Software Engineering#Defect Analysis#Repository Mining

Review 의 다른글