[논문리뷰] OmniGameArena: A Unified UE5 Benchmark for VLM Game Agents with Improvement Dynamics본 논문은 기존 VLM Agent 벤치마크가 단일 시도(First-attempt) 점수만을 보고하고, Solo 플레이 위주로 구성되어 있어 에이전트의 학습 및 개선 능력을 측정하지 못한다는 문제를 지적한다.#Review#VLM Agents#Benchmark#Unreal Engine 5#Improvement Dynamics#Agentic Reflection#Cold-start#Generalization2026년 6월 8일댓글 수 로딩 중