본문으로 건너뛰기

#Visual Perception

7개의 포스트

[논문리뷰] MVI-Bench: A Comprehensive Benchmark for Evaluating Robustness to Misleading Visual Inputs in LVLMs

댓글 수 로딩 중

[논문리뷰] GeoPQA: Bridging the Visual Perception Gap in MLLMs for Geometric Reasoning

댓글 수 로딩 중

[논문리뷰] Detect Anything via Next Point Prediction

댓글 수 로딩 중