[논문리뷰] Agent-ValueBench: A Comprehensive Benchmark for Evaluating Agent Values본 연구는 autonomous agents의 가치 체계가 기반이 되는 LLM의 가치와는 본질적으로 다르며, 이를 체계적으로 평가할 수 있는 도구가 부재하다는 문제 의식에서 출발합니다. 기존의 ValueBench나 ValueCompass와 같은 연구들은 주로 정적인 텍스트 생성 모델의 가치 평가에만 국한되어 있습니다.#Review#Autonomous Agents#Value Alignment#Benchmark#Agentic Modality#Harness Alignment#Skill Steering2026년 5월 12일댓글 수 로딩 중