본문으로 건너뛰기

#Object Grounding

6개의 포스트

[논문리뷰] LIBERO-Para: A Diagnostic Benchmark and Metrics for Paraphrase Robustness in VLA Models

댓글 수 로딩 중

[논문리뷰] Video4Spatial: Towards Visuospatial Intelligence with Context-Guided Video Generation

댓글 수 로딩 중

[논문리뷰] Artemis: Structured Visual Reasoning for Perception Policy Learning

댓글 수 로딩 중

[논문리뷰] Lavida-O: Elastic Large Masked Diffusion Models for Unified Multimodal Understanding and Generation

댓글 수 로딩 중

[논문리뷰] VLM-FO1: Bridging the Gap Between High-Level Reasoning and Fine-Grained Perception in VLMs

댓글 수 로딩 중