본문으로 건너뛰기

#Multimodal Retrieval

13개의 포스트

[논문리뷰] V-Retrver: Evidence-Driven Agentic Reasoning for Universal Multimodal Retrieval

댓글 수 로딩 중

[논문리뷰] OS-Symphony: A Holistic Framework for Robust and Generalist Computer-Using Agent

댓글 수 로딩 중

[논문리뷰] Qwen3-VL-Embedding and Qwen3-VL-Reranker: A Unified Framework for State-of-the-Art Multimodal Retrieval and Ranking

댓글 수 로딩 중

[논문리뷰] Vote-in-Context: Turning VLMs into Zero-Shot Rank Fusers

댓글 수 로딩 중

[논문리뷰] X-CoT: Explainable Text-to-Video Retrieval via LLM-based Chain-of-Thought Reasoning

댓글 수 로딩 중

[논문리뷰] MetaEmbed: Scaling Multimodal Retrieval at Test-Time with Flexible Late Interaction

댓글 수 로딩 중

[논문리뷰] VisR-Bench: An Empirical Study on Visual Retrieval-Augmented Generation for Multilingual Long Document Understanding

댓글 수 로딩 중

[논문리뷰] FG-CLIP 2: A Bilingual Fine-grained Vision-Language Alignment Model

댓글 수 로딩 중

[논문리뷰] MRMR: A Realistic and Expert-Level Multidisciplinary Benchmark for Reasoning-Intensive Multimodal Retrieval

댓글 수 로딩 중

[논문리뷰] TalkPlay-Tools: Conversational Music Recommendation with LLM Tool Calling

댓글 수 로딩 중

[논문리뷰] Towards Mixed-Modal Retrieval for Universal Retrieval-Augmented Generation

댓글 수 로딩 중