본문으로 건너뛰기

#Perception

7개의 포스트

[논문리뷰] MMSI-Video-Bench: A Holistic Benchmark for Video-Based Spatial Intelligence

댓글 수 로딩 중

[논문리뷰] Phi-Ground Tech Report: Advancing Perception in GUI Grounding

댓글 수 로딩 중

[논문리뷰] Ming-Flash-Omni: A Sparse, Unified Architecture for Multimodal Perception and Generation

댓글 수 로딩 중

[논문리뷰] OceanGym: A Benchmark Environment for Underwater Embodied Agents

댓글 수 로딩 중