[논문리뷰] BeyondSWE: Can Current Code Agent Survive Beyond Single-Repo Bug Fixing?본 논문은 기존 코드 에이전트 벤치마크가 단일 저장소 버그 수정에 국한되어 크로스-저장소 추론, 도메인-특화 문제 해결, 의존성 기반 마이그레이션, 전체 저장소 생성과 같은 실제 소프트웨어 엔지니어링의 복잡한 요구사항을 간과하고 있음을 지적합니다.#Review#Code Agent Evaluation#Software Engineering LLMs#Cross-Repository Reasoning#Dependency Migration#Repository Generation#BeyondSWE#SearchSWE#External Knowledge Integration2026년 3월 3일댓글 수 로딩 중
[논문리뷰] Closing the Loop: Universal Repository Representation with RPG-Encoder현재 리포지토리 에이전트들이 단편적인 코드 표현 방식(API 문서, 의존성 그래프)으로 인해 겪는 추론 단절 문제 를 해결하는 것이 목표입니다.#Review#Code Representation#LLM Agent#Software Engineering AI#Repository Understanding#Repository Generation#Repository Planning Graph (RPG)#Semantic Lifting#Incremental Code Maintenance2026년 2월 2일댓글 수 로딩 중
[논문리뷰] NL2Repo-Bench: Towards Long-Horizon Repository Generation Evaluation of Coding Agents이 논문은 기존 코딩 에이전트 벤치마크들이 완전한 소프트웨어 시스템을 구축하는 데 필요한 장기적인 추론 능력 을 엄격하게 평가하지 못하는 문제를 해결하고자 합니다.#Review#Coding Agents#LLMs#Software Engineering#Repository Generation#Long-Horizon Reasoning#Benchmark#Python Development#Autonomous Systems2025년 12월 15일댓글 수 로딩 중