본문으로 건너뛰기

#Multimodal Benchmark

6개의 포스트

[논문리뷰] ViMU: Benchmarking Video Metaphorical Understanding

댓글 수 로딩 중

[논문리뷰] MiroEval: Benchmarking Multimodal Deep Research Agents in Process and Outcome

댓글 수 로딩 중

[논문리뷰] How Well Do Models Follow Visual Instructions? VIBE: A Systematic Benchmark for Visual Instruction-Driven Image Editing

댓글 수 로딩 중

[논문리뷰] What Users Leave Unsaid: Under-Specified Queries Limit Vision-Language Models

댓글 수 로딩 중

[논문리뷰] left|,circlearrowright,text{BUS},right|: A Large and Diverse Multimodal Benchmark for evaluating the ability of Vision-Language Models to understand Rebus Puzzles

댓글 수 로딩 중