[논문리뷰] iOSWorld: A Benchmark for Personally Intelligent Phone Agents본 논문은 기존 모바일 에이전트 벤치마크가 사용자의 지속적인 데이터와 상호 연관된 개인적 문맥을 결여하고 있다는 점을 지적하며, '개인 지능(Personal Intelligence)'을 갖춘 에이전트 평가의 필요성을 제기합니다.#Review#iOSWorld#Mobile Agents#Personal Intelligence#Human-Computer Interaction#LLM-as-a-Judge#Multi-app Reasoning#Simulator Benchmark2026년 6월 17일댓글 수 로딩 중