#iOSWorld

1개의 포스트

[논문리뷰] iOSWorld: A Benchmark for Personally Intelligent Phone Agents

본 논문은 기존 모바일 에이전트 벤치마크가 사용자의 지속적인 데이터와 상호 연관된 개인적 문맥을 결여하고 있다는 점을 지적하며, '개인 지능(Personal Intelligence)'을 갖춘 에이전트 평가의 필요성을 제기합니다.

#Review #iOSWorld #Mobile Agents #Personal Intelligence #Human-Computer Interaction #LLM-as-a-Judge #Multi-app Reasoning #Simulator Benchmark

2026년 6월 17일