[논문리뷰] Learn from Weaknesses: Automated Domain Specialization for Small Computer-Use Agents본 논문은 소규모(Small) 오픈소스 CUA들이 다양한 소프트웨어 환경에서 도메인 특화 성능이 여전히 부족하다는 점을 해결하고자 합니다.#Review#Computer-Use Agent#Domain Specialization#Annotation-free#Weakness-aware#Direct Preference Optimization#GUI Agent2026년 5월 27일댓글 수 로딩 중
[논문리뷰] GameWorld: Towards Standardized and Verifiable Evaluation of Multimodal Game Agents본 연구는 Multimodal Large Language Model(MLLM) 기반 게임 에이전트의 체계적인 평가를 가로막는 표준화된 인터페이스의 부재와 검증 방식의 한계를 극복하기 위해 수행되었습니다.#Review#Multimodal Large Language Model#Game Agent#Benchmark#Standardized Evaluation#Computer-Use Agent#Semantic Action Parsing#Outcome-based Evaluation2026년 4월 15일댓글 수 로딩 중