[논문리뷰] FutureSim: Replaying World Events to Evaluate Adaptive Agents본 연구는 AI 에이전트가 변화하는 현실 세계 환경에서 적응형 예측을 수행하는 능력을 실질적으로 측정하기 위한 표준화된 시뮬레이션 환경의 부재를 해결하고자 합니다. 기존의 게임 기반이나 정적인 벤치마크는 실제 사회적 진화와 사건의 연대기적 특성을 반영하지 못한다는 한계가 있습니다.#Review#Adaptive Agents#Long-horizon Forecasting#Test-time Adaptation#Chronological Replay#Agentic Search#Brier Skill Score2026년 5월 14일댓글 수 로딩 중