본문으로 건너뛰기

#Compositional Reasoning

7개의 포스트

[논문리뷰] VTC-Bench: Evaluating Agentic Multimodal Models via Compositional Visual Tool Chaining

댓글 수 로딩 중

[논문리뷰] Half-Truths Break Similarity-Based Retrieval

댓글 수 로딩 중

[논문리뷰] Rethinking Composed Image Retrieval Evaluation: A Fine-Grained Benchmark from Image Editing

댓글 수 로딩 중

[논문리뷰] Easier Painting Than Thinking: Can Text-to-Image Models Set the Stage, but Not Direct the Play?

댓글 수 로딩 중

[논문리뷰] MIRO: MultI-Reward cOnditioned pretraining improves T2I quality and efficiency

댓글 수 로딩 중

[논문리뷰] SRUM: Fine-Grained Self-Rewarding for Unified Multimodal Models

댓글 수 로딩 중

[논문리뷰] Grasp Any Region: Towards Precise, Contextual Pixel Understanding for Multimodal LLMs

댓글 수 로딩 중