[논문리뷰] SWE-Explore: Benchmarking How Coding Agents Explore Repositories본 논문은 기존의 SWE-bench와 같은 벤치마크가 이슈 해결 여부를 이분법적(성공/실패)으로만 판단하여, 에이전트의 내부적인 탐색, 위치 파악, 맥락 추출 능력을 측정하지 못하는 문제를 해결하고자 합니다 .#Review#Repository-level Coding#Coding Agents#Repository Exploration#Line-level Benchmark#Context Retrieval#Software Engineering2026년 6월 8일댓글 수 로딩 중
[논문리뷰] Think-on-Graph 3.0: Efficient and Adaptive LLM Reasoning on Heterogeneous Graphs via Multi-Agent Dual-Evolving Context Retrieval본 논문은 기존 그래프 기반 RAG 시스템이 직면한 정적 그래프 인덱스 구축의 한계 와 LLM 추출기의 성능 의존성 문제를 해결하는 것을 목표로 합니다.#Review#RAG#LLM Reasoning#Knowledge Graphs#Multi-Agent Systems#Context Retrieval#Heterogeneous Graphs#Adaptive Learning#Dual-Evolution2025년 9월 29일댓글 수 로딩 중