[논문리뷰] VibeSearchBench: Benchmarking Long-horizon Proactive Search in the Wild본 논문은 LLM 기반 에이전트가 기존 벤치마크에서는 높은 성능을 보임에도 불구하고, 실사용 환경에서는 사용자 만족도가 낮은 'Evaluation–Experience Gap' 문제를 해결하고자 한다.#Review#VibeSearch#Proactive Search#Large Language Models#Agent Harness#Knowledge Graph#Benchmark2026년 5월 27일댓글 수 로딩 중