[논문리뷰] Towards Retrieving Interaction Spaces for Agentic Search본 논문은 기존의 Agentic Search 방식이 가진 확장성 및 효율성 문제를 해결하기 위해 제안되었습니다.#Review#Agentic Search#Retrieval-Augmented Generation#Direct Corpus Interaction#Interaction Space#Information Retrieval#LLM2026년 6월 7일댓글 수 로딩 중
[논문리뷰] Critic-R: Improving Agentic Search using Instruction-tuned Retrievers with Natural Language Introspective Feedback본 논문은 Agentic Search 환경에서 기존 Retriever의 경직성이 전체 시스템 성능의 병목 현상(bottleneck)을 유발한다는 점을 해결하고자 합니다 . 기존 연구들은 주로 Reasoning Agent만을 최적화하거나, Retriever를 고정된 블랙박스로 간주하는 한계를 보입니다.#Review#Agentic Search#Retrieval-Augmented Generation#Instruction-tuned Retriever#Inference-time Scaling#Contrastive Learning#Introspective Feedback2026년 6월 7일댓글 수 로딩 중
[논문리뷰] Masking Stale Observations Helps Search Agents -- Until It Doesn't: A Regime Map and Its Mechanism본 논문은 에이전트의 장기 궤적에서 발생하는 문맥 과부하 문제를 해결하기 위한 Observation Masking 기법이 특정 조건에서만 유효하게 작동하는 근본적인 이유를 규명하고자 합니다.#Review#Agentic Search#Context Management#Observation Masking#Retriever-Model Mismatch#Model Saturation2026년 6월 1일댓글 수 로딩 중
[논문리뷰] FineVerify: Scaling Test-Time Compute with Fine-Grained Self-Verification for Agentic Search본 논문은 기존의 Agentic Search 모델들이 겪는 정답의 희소성 문제와 기존 Test-Time Compute scaling 기법들이 가진 신뢰성 한계를 해결하고자 합니다.#Review#Agentic Search#Test-Time Compute#Self-Verification#Fine-Grained#LLM#Benchmark Auditing2026년 6월 1일댓글 수 로딩 중
[논문리뷰] SAAS: Self-Aware Reinforcement Learning for Over-Search Mitigation in Agentic Search본 논문은 Agentic Search 시스템에서 발생하는 심각한 Over-search 문제를 해결하기 위해 SAAS 프레임워크를 제안합니다.#Review#Agentic Search#Reinforcement Learning#Over-Search Mitigation#Knowledge Boundary#Search Efficiency#Reward Hacking2026년 5월 31일댓글 수 로딩 중
[논문리뷰] GrepSeek: Training Search Agents for Direct Corpus Interaction본 논문은 기존의 retrieval-augmented agentic search 시스템이 pre-computed index와 retriever에 의존함으로써 발생하는 한계를 해결하고자 합니다.#Review#Direct Corpus Interaction#Search Agent#Reinforcement Learning#Sharded-Parallel Execution#Information Retrieval#Agentic Search2026년 5월 31일댓글 수 로딩 중
[논문리뷰] FutureSim: Replaying World Events to Evaluate Adaptive Agents본 연구는 AI 에이전트가 변화하는 현실 세계 환경에서 적응형 예측을 수행하는 능력을 실질적으로 측정하기 위한 표준화된 시뮬레이션 환경의 부재를 해결하고자 합니다. 기존의 게임 기반이나 정적인 벤치마크는 실제 사회적 진화와 사건의 연대기적 특성을 반영하지 못한다는 한계가 있습니다.#Review#Adaptive Agents#Long-horizon Forecasting#Test-time Adaptation#Chronological Replay#Agentic Search#Brier Skill Score2026년 5월 14일댓글 수 로딩 중
[논문리뷰] Beyond Stochastic Exploration: What Makes Training Data Valuable for Agentic Search본 논문은 기존 RL 기반 Search Agent가 겪는 스토캐스틱 탐색(Stochastic Exploration)의 비효율성과 훈련 불안정성 문제를 해결하고자 합니다.#Review#Agentic Search#Reinforcement Learning#Hierarchical Experience#Policy Optimization#Contrastive Distillation#Self-Reflection2026년 4월 9일댓글 수 로딩 중
[논문리뷰] Marco DeepResearch: Unlocking Efficient Deep Research Agents via Verification-Centric Design최근 Deep Research 분야는 급격히 발전했으나, 기존 에이전트 시스템은 QA 데이터 합성, 궤적 생성, 추론 단계에서 명시적인 검증 기법이 부재하다는 치명적인 한계를 가진다. 이로 인해 초기 단계의 오류가 하위 단계로 전파되어 전체 성능을 크게 저하시키는 문제가 발생한다 .#Review#Deep Research#Agentic Search#Verification-Centric Design#Data Synthesis#Test-time Scaling#ReAct#Multi-agent Systems2026년 3월 30일댓글 수 로딩 중
[논문리뷰] Agentic-R: Learning to Retrieve for Agentic Search본 논문은 멀티턴 에이전트 검색(agentic search)의 맥락에서 리트리버(retriever) 훈련의 한계를 극복하는 것을 목표로 합니다.#Review#Agentic Search#Retrieval-Augmented Generation#Retriever Training#Passage Utility Modeling#Iterative Optimization#Reinforcement Learning#Large Language Models2026년 1월 20일댓글 수 로딩 중
[논문리뷰] MemGovern: Enhancing Code Agents through Learning from Governed Human Experiences자율 소프트웨어 엔지니어링(SWE) 에이전트가 GitHub와 같은 플랫폼에 축적된 방대한 인간 경험을 효과적으로 활용하지 못하는 '닫힌 세계' 한계를 해결하는 것이 목표입니다.#Review#Code Agents#Software Engineering#Experiential Memory#GitHub Data#Experience Governance#Agentic Search#LLM Applications#Bug Fixing2026년 1월 13일댓글 수 로딩 중
[논문리뷰] Beyond Ten Turns: Unlocking Long-Horizon Agentic Search with Large-Scale Asynchronous RL본 논문은 기존 오픈소스 LLM 기반 에이전트의 '검색 인텔리전스'가 전문가 수준에 미치지 못하며, 모호한 질의 해결, 정확한 검색 생성, 결과 분석 및 심층 탐색 능력에서 한계를 보이는 문제를 해결하고자 합니다.#Review#Reinforcement Learning#LLM Agents#Agentic Search#Asynchronous RL#Long-Horizon Planning#Tool Use#Data Synthesis2025년 8월 13일댓글 수 로딩 중
[논문리뷰] WideSearch: Benchmarking Agentic Broad Info-Seeking본 논문은 광범위한 정보 탐색(WideSearch) 작업에서 LLM 기반 에이전트의 신뢰성과 완성도를 평가하기 위한 새로운 벤치마크를 제시합니다. 이는 기존 벤치마크가 놓치고 있던, 대규모의 원자적 정보를 철저하고 정확하게 수집하여 잘 정리된 출력으로 구성 하는 실세계 정보 탐색 시나리오를 평가하는 데 중점을 둡니다.#Review#Agentic Search#LLM#Benchmark#Information Seeking#Structured Output#Evaluation Metrics#Multi-agent Systems2025년 8월 12일댓글 수 로딩 중