[논문리뷰] WorldMM: Dynamic Multimodal Memory Agent for Long Video Reasoning이 [arXiv]에 게시한 'WorldMM: Dynamic Multimodal Memory Agent for Long Video Reasoning' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일
[논문리뷰] Video4Spatial: Towards Visuospatial Intelligence with Context-Guided Video GenerationYu Ning이 [arXiv]에 게시한 'Video4Spatial: Towards Visuospatial Intelligence with Context-Guided Video Generation' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일
[논문리뷰] ViSAudio: End-to-End Video-Driven Binaural Spatial Audio Generation이 [arXiv]에 게시한 'ViSAudio: End-to-End Video-Driven Binaural Spatial Audio Generation' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일
[논문리뷰] The Curious Case of Analogies: Investigating Analogical Reasoning in Large Language Models이 [arXiv]에 게시한 'The Curious Case of Analogies: Investigating Analogical Reasoning in Large Language Models' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일
[논문리뷰] TRivia: Self-supervised Fine-tuning of Vision-Language Models for Table RecognitionZichen Wen이 [arXiv]에 게시한 'TRivia: Self-supervised Fine-tuning of Vision-Language Models for Table Recognition' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일
[논문리뷰] SwiftVLA: Unlocking Spatiotemporal Dynamics for Lightweight VLA Models at Minimal Overhead이 [arXiv]에 게시한 'SwiftVLA: Unlocking Spatiotemporal Dynamics for Lightweight VLA Models at Minimal Overhead' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일
[논문리뷰] Skywork-R1V4: Toward Agentic Multimodal Intelligence through Interleaved Thinking with Images and DeepResearch이 [arXiv]에 게시한 'Skywork-R1V4: Toward Agentic Multimodal Intelligence through Interleaved Thinking with Images and DeepResearch' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일
[논문리뷰] SimWorld: An Open-ended Realistic Simulator for Autonomous Agents in Physical and Social WorldsXuhong He이 [arXiv]에 게시한 'SimWorld: An Open-ended Realistic Simulator for Autonomous Agents in Physical and Social Worlds' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일
[논문리뷰] SimScale: Learning to Drive via Real-World Simulation at Scale이 [arXiv]에 게시한 'SimScale: Learning to Drive via Real-World Simulation at Scale' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일
[논문리뷰] Revisiting the Necessity of Lengthy Chain-of-Thought in Vision-centric Reasoning Generalization이 [arXiv]에 게시한 'Revisiting the Necessity of Lengthy Chain-of-Thought in Vision-centric Reasoning Generalization' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일
[논문리뷰] PAI-Bench: A Comprehensive Benchmark For Physical AIHumphrey Shi이 [arXiv]에 게시한 'PAI-Bench: A Comprehensive Benchmark For Physical AI' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일
[논문리뷰] MultiShotMaster: A Controllable Multi-Shot Video Generation Framework이 [arXiv]에 게시한 'MultiShotMaster: A Controllable Multi-Shot Video Generation Framework' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일
[논문리뷰] Mixture of Horizons in Action ChunkingZelong Sun이 [arXiv]에 게시한 'Mixture of Horizons in Action Chunking' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일
[논문리뷰] Masks Can Be Distracting: On Context Comprehension in Diffusion Language Models이 [arXiv]에 게시한 'Masks Can Be Distracting: On Context Comprehension in Diffusion Language Models' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일
[논문리뷰] MG-Nav: Dual-Scale Visual Navigation via Sparse Spatial Memory이 [arXiv]에 게시한 'MG-Nav: Dual-Scale Visual Navigation via Sparse Spatial Memory' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일
[논문리뷰] Guided Self-Evolving LLMs with Minimal Human Supervision이 [arXiv]에 게시한 'Guided Self-Evolving LLMs with Minimal Human Supervision' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일
[논문리뷰] Glance: Accelerating Diffusion Models with 1 SampleLinjie Li이 [arXiv]에 게시한 'Glance: Accelerating Diffusion Models with 1 Sample' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일
[논문리뷰] GUI Exploration Lab: Enhancing Screen Navigation in Agents via Multi-Turn Reinforcement LearningKaijun Tan이 [arXiv]에 게시한 'GUI Exploration Lab: Enhancing Screen Navigation in Agents via Multi-Turn Reinforcement Learning' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일
[논문리뷰] DualCamCtrl: Dual-Branch Diffusion Model for Geometry-Aware Camera-Controlled Video GenerationZixin Zhang이 [arXiv]에 게시한 'DualCamCtrl: Dual-Branch Diffusion Model for Geometry-Aware Camera-Controlled Video Generation' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일
[논문리뷰] Does Hearing Help Seeing? Investigating Audio-Video Joint Denoising for Video Generation이 [arXiv]에 게시한 'Does Hearing Help Seeing? Investigating Audio-Video Joint Denoising for Video Generation' 논문에 대한 자세한 리뷰입니다.2025년 12월 3일