[논문리뷰] CoffeeBench: Benchmarking Long-Horizon LLM Agents in Heterogeneous Multi-Agent Economies본 논문은 기존 LLM 에이전트 벤치마크가 단일 에이전트나 동질적인 환경에 국한되어, 현실적인 경제 시스템의 복잡성을 반영하지 못하는 한계를 해결하고자 한다.#Review#LLM Agents#Long-Horizon#Multi-Agent Economy#Benchmark#Supply Chain#Decision-making2026년 6월 25일댓글 수 로딩 중