[논문리뷰] V-Zero: Answer-Label-Free On-Policy Distillation with Contrastive Evidence Gating for Fine-Grained Visual Reasoning본 논문은 Fine-grained visual reasoning 분야에서 요구되는 고비용의 RL 기반 탐색 및 대규모 텍스트 레이블 의존 문제를 해결하기 위해 제안되었습니다.#Review#Multimodal Large Language Models#On-Policy Distillation#Fine-Grained Visual Reasoning#Contrastive Evidence Gating#Visual Grounding2026년 6월 24일댓글 수 로딩 중