[논문리뷰] K-BrowseComp: A Web Browsing Agent Benchmark Grounded in Korean Contexts본 논문은 최신 Frontier 모델들이 Agentic Capability 평가로 패러다임을 전환하고 있음에도 불구하고, 한국어 환경에 특화된 브라우징 에이전트 벤치마크가 부재하다는 문제 의식에서 출발합니다.#Review#Web Browsing Agent#Korean Contexts#Agentic Benchmark#Information Retrieval#Multi-hop Reasoning#Synthetic Data Generation2026년 6월 1일댓글 수 로딩 중