[논문리뷰] MobileWorld: Benchmarking Autonomous Mobile Agents in Agent-User Interactive, and MCP-Augmented Environments기존 모바일 GUI 에이전트 벤치마크인 AndroidWorld 의 포화 상태(90% 이상의 성공률)와 현실적이지 않은 태스크 복잡성 한계를 극복하는 것을 목표로 합니다.#Review#Mobile Agents#GUI Benchmarking#Agent-User Interaction#Tool-Augmented Agents#Model Context Protocol (MCP)#Long-Horizon Tasks#Reproducible Evaluation#Android Environment2025년 12월 22일댓글 수 로딩 중