[논문리뷰] BeyondSWE: Can Current Code Agent Survive Beyond Single-Repo Bug Fixing?본 논문은 기존 코드 에이전트 벤치마크가 단일 저장소 버그 수정에 국한되어 크로스-저장소 추론, 도메인-특화 문제 해결, 의존성 기반 마이그레이션, 전체 저장소 생성과 같은 실제 소프트웨어 엔지니어링의 복잡한 요구사항을 간과하고 있음을 지적합니다.#Review#Code Agent Evaluation#Software Engineering LLMs#Cross-Repository Reasoning#Dependency Migration#Repository Generation#BeyondSWE#SearchSWE#External Knowledge Integration2026년 3월 3일댓글 수 로딩 중