[논문리뷰] One Forward Beats Two: InnerZoom for Accurate and Efficient GUI Grounding본 논문은 MLLM 기반의 GUI Grounding에서 나타나는 비효율성과 정확도 저하 문제를 해결하고자 합니다. 기존의 ZoomIn 계열 방식은 타겟 영역을 외부에서 크롭하여 두 번 추론(Two-pass)함으로써 정확도를 높였으나, 이는 Latency를 증가시키고 계산 비용을 높이는 원인이 됩니다.#Review#GUI Grounding#MLLM#Cross-Layer Evidence#Coordinate Generation#InnerZoom#Efficient Inference#Region-to-Point Gap2026년 6월 29일댓글 수 로딩 중