[논문리뷰] Benchmarking AI Agents for Addressing Scientific Challenges Across Scales본 논문은 기존 AI agent 벤치마크가 과학 연구의 복잡성과 상호작용적인 성격을 충분히 반영하지 못하는 한계를 해결하고자 합니다. 기존의 연구들은 지나치게 정적인 과제에 국한되어 있거나, 과학적 도메인의 특수성(데이터의 이질성, 다단계 의존성 등)을 고려하지 않아 실질적인 과학적 기여도를 측정하는 데 미흡했습니다.#Review#AI Agents#Scientific Discovery#Benchmarking#Computational Science#Multi-scale Modeling#Evaluation Framework2026년 6월 14일댓글 수 로딩 중