[논문리뷰] TACO: Tool-Augmented Credit Optimization for Agentic Tool Use본 논문은 에이전트의 불필요하거나 오도하는 도구 호출 문제를 해결하기 위해, 도구 호출 자체의 기여도를 정밀하게 평가하는 최적화 프레임워크를 제안한다.#Review#Agentic Tool Use#Reinforcement Learning#Multimodal Models#Credit Assignment#Tool-Augmented Credit Optimization#GRPO#Differential Answer-Probe Reward2026년 6월 29일댓글 수 로딩 중