[논문리뷰] VISTA: View-Consistent Self-Verified Training for GUI Grounding본 논문은 기존의 GRPO를 활용한 GUI Grounding 학습에서 발생하는 보상 퇴화(reward degeneracy) 문제를 해결하는 데 집중합니다.#Review#GUI Grounding#GRPO#Self-Verified Training#View-Consistent#Reinforcement Learning#VLM2026년 6월 14일댓글 수 로딩 중