[논문리뷰] When Tools Fail: Benchmarking Dynamic Replanning and Anomaly Recovery in LLM Agents본 논문은 기존의 LLM 에이전트 벤치마크들이 이상적인 'Happy Path' 환경만을 상정하여, 현실의 불안정한 도구 실행 및 오류 상황을 제대로 평가하지 못하는 한계를 지적한다.#Review#LLM Agents#Tool-Integrated Reasoning#Fault-Tolerance#Dynamic Replanning#Anomaly Recovery#Benchmark#DAG-based Task Generation2026년 6월 7일댓글 수 로딩 중