[논문리뷰] QUEST: Training Frontier Deep Research Agents with Fully Synthetic Tasks본 논문은 Deep Research Agents의 광범위한 역량을 갖춘 훈련 방식의 불투명성과 기존 Open-weight 모델들의 한계점을 해결하고자 한다.#Review#Deep Research Agents#Synthetic Data#Rubric Tree#Context Management#Reinforcement Learning#Fact Seeking#Citation Grounding#Report Synthesis2026년 5월 25일댓글 수 로딩 중