[논문리뷰] MMSI-Video-Bench: A Holistic Benchmark for Video-Based Spatial IntelligencePeizhou Cao이 arXiv에 게시한 'MMSI-Video-Bench: A Holistic Benchmark for Video-Based Spatial Intelligence' 논문에 대한 자세한 리뷰입니다.2025년 12월 17일댓글 수 로딩 중
[논문리뷰] Ming-Flash-Omni: A Sparse, Unified Architecture for Multimodal Perception and GenerationarXiv에 게시된 'Ming-Flash-Omni: A Sparse, Unified Architecture for Multimodal Perception and Generation' 논문에 대한 자세한 리뷰입니다.2025년 10월 30일댓글 수 로딩 중
[논문리뷰] OceanGym: A Benchmark Environment for Underwater Embodied AgentsarXiv에 게시된 'OceanGym: A Benchmark Environment for Underwater Embodied Agents' 논문에 대한 자세한 리뷰입니다.2025년 10월 1일댓글 수 로딩 중
[논문리뷰] Video models are zero-shot learners and reasonersrgeirhos이 arXiv에 게시한 'Video models are zero-shot learners and reasoners' 논문에 대한 자세한 리뷰입니다.2025년 9월 25일댓글 수 로딩 중
[논문리뷰] UItron: Foundational GUI Agent with Advanced Perception and PlanningYufeng Zhong이 arXiv에 게시한 'UItron: Foundational GUI Agent with Advanced Perception and Planning' 논문에 대한 자세한 리뷰입니다.2025년 9월 1일댓글 수 로딩 중
[논문리뷰] Phi-Ground Tech Report: Advancing Perception in GUI GroundingKai Qiu이 arXiv에 게시한 'Phi-Ground Tech Report: Advancing Perception in GUI Grounding' 논문에 대한 자세한 리뷰입니다.2025년 8월 2일댓글 수 로딩 중