[논문리뷰] Web Retrieval-Aware Chunking (W-RAC) for Efficient and Cost-Effective Retrieval-Augmented Generation Systems본 논문은 문서 청킹을 텍스트 생성이 아닌 '계획 문제(Planning Problem)'로 재정의하여 W-RAC를 제안합니다. 이 시스템은 세 단계로 구성되는데, 먼저 웹 콘텐츠를 구조화하여 ID를 할당하고, LLM은 오직 ID 리스트 기반의 최적 그룹화 계획만을 수립하며, 마지막으로 로컬에서 ID를 매핑하여 최종 청크를 조립합니다 .#Review#Retrieval-Augmented Generation#Document Chunking#Web Parsing#Cost-Efficiency#Semantic Planning#Scalability2026년 4월 19일댓글 수 로딩 중
[논문리뷰] SERA: Soft-Verified Efficient Repository Agents본 논문은 폐쇄형 시스템 대비 오픈 소스 코딩 에이전트의 강점인 사설 코드베이스 특화 능력 을 저비용으로 실현하는 것을 목표로 합니다. 기존 훈련 방식의 높은 비용과 복잡성으로 인해 이론에 머물렀던 이점을 극복하고, 효율적인 데이터 생성 및 학습 방법론 을 제시하여 실질적인 적용 가능성을 입증하고자 합니다.#Review#Coding Agents#Synthetic Data Generation#Repository Specialization#Supervised Finetuning#Soft Verification#Cost-Efficiency#SWE-bench2026년 1월 28일댓글 수 로딩 중