[논문리뷰] OmniGUI: Benchmarking GUI Agents in Omni-Modal Smartphone Environments본 논문은 기존 GUI 에이전트 벤치마크가 정적 스크린샷 위주로 구성되어 있어, 실시간 환경에서 요구되는 동적 오디오 및 비디오 처리 능력을 평가하지 못한다는 한계를 해결하고자 한다 .#Review#GUI Agents#Multimodal Benchmark#Smartphone Environments#Temporal Reasoning#Auditory Processing#Action Grounding2026년 5월 19일댓글 수 로딩 중