[논문리뷰] DynamicVerse: A Physically-Aware Multimodal Framework for 4D World Modeling이 [arXiv]에 게시한 'DynamicVerse: A Physically-Aware Multimodal Framework for 4D World Modeling' 논문에 대한 자세한 리뷰입니다.2025년 12월 5일
[논문리뷰] DraCo: Draft as CoT for Text-to-Image Preview and Rare Concept GenerationZiyu Guo이 [arXiv]에 게시한 'DraCo: Draft as CoT for Text-to-Image Preview and Rare Concept Generation' 논문에 대한 자세한 리뷰입니다.2025년 12월 5일
[논문리뷰] DAComp: Benchmarking Data Agents across the Full Data Intelligence Lifecycle이 [arXiv]에 게시한 'DAComp: Benchmarking Data Agents across the Full Data Intelligence Lifecycle' 논문에 대한 자세한 리뷰입니다.2025년 12월 5일
[논문리뷰] BulletTime: Decoupled Control of Time and Camera Pose for Video GenerationJan Ackermann이 [arXiv]에 게시한 'BulletTime: Decoupled Control of Time and Camera Pose for Video Generation' 논문에 대한 자세한 리뷰입니다.2025년 12월 5일
[논문리뷰] ARM-Thinker: Reinforcing Multimodal Generative Reward Models with Agentic Tool Use and Visual Reasoning이 [arXiv]에 게시한 'ARM-Thinker: Reinforcing Multimodal Generative Reward Models with Agentic Tool Use and Visual Reasoning' 논문에 대한 자세한 리뷰입니다.2025년 12월 5일
[논문리뷰] Aligned but Stereotypical? The Hidden Influence of System Prompts on Social Bias in LVLM-Based Text-to-Image Models이 [arXiv]에 게시한 'Aligned but Stereotypical? The Hidden Influence of System Prompts on Social Bias in LVLM-Based Text-to-Image Models' 논문에 대한 자세한 리뷰입니다.2025년 12월 5일
[논문리뷰] 4DLangVGGT: 4D Language-Visual Geometry Grounded Transformer이 [arXiv]에 게시한 '4DLangVGGT: 4D Language-Visual Geometry Grounded Transformer' 논문에 대한 자세한 리뷰입니다.2025년 12월 5일
[논문리뷰] ViDiC: Video Difference CaptioningjiakaiW이 [arXiv]에 게시한 'ViDiC: Video Difference Captioning' 논문에 대한 자세한 리뷰입니다.2025년 12월 4일
[논문리뷰] UniQL: Unified Quantization and Low-rank Compression for Adaptive Edge LLMs이 [arXiv]에 게시한 'UniQL: Unified Quantization and Low-rank Compression for Adaptive Edge LLMs' 논문에 대한 자세한 리뷰입니다.2025년 12월 4일
[논문리뷰] Thinking with Programming Vision: Towards a Unified View for Thinking with ImagesTao Jin이 [arXiv]에 게시한 'Thinking with Programming Vision: Towards a Unified View for Thinking with Images' 논문에 대한 자세한 리뷰입니다.2025년 12월 4일
[논문리뷰] Steering Vision-Language-Action Models as Anti-Exploration: A Test-Time Scaling ApproachXiu Li이 [arXiv]에 게시한 'Steering Vision-Language-Action Models as Anti-Exploration: A Test-Time Scaling Approach' 논문에 대한 자세한 리뷰입니다.2025년 12월 4일
[논문리뷰] SR-GRPO: Stable Rank as an Intrinsic Geometric Reward for Large Language Model AlignmentYi Yang이 [arXiv]에 게시한 'SR-GRPO: Stable Rank as an Intrinsic Geometric Reward for Large Language Model Alignment' 논문에 대한 자세한 리뷰입니다.2025년 12월 4일
[논문리뷰] SpaceTools: Tool-Augmented Spatial Reasoning via Double Interactive RL이 [arXiv]에 게시한 'SpaceTools: Tool-Augmented Spatial Reasoning via Double Interactive RL' 논문에 대한 자세한 리뷰입니다.2025년 12월 4일
[논문리뷰] SkillFactory: Self-Distillation For Learning Cognitive BehaviorsManya Wadhwa이 [arXiv]에 게시한 'SkillFactory: Self-Distillation For Learning Cognitive Behaviors' 논문에 대한 자세한 리뷰입니다.2025년 12월 4일
[논문리뷰] RELIC: Interactive Video World Model with Long-Horizon MemoryChongjian Ge이 [arXiv]에 게시한 'RELIC: Interactive Video World Model with Long-Horizon Memory' 논문에 대한 자세한 리뷰입니다.2025년 12월 4일
[논문리뷰] Qwen3-VL Technical Report이 [arXiv]에 게시한 'Qwen3-VL Technical Report' 논문에 대한 자세한 리뷰입니다.2025년 12월 4일
[논문리뷰] PretrainZero: Reinforcement Active PretrainingGuoqi Li이 [arXiv]에 게시한 'PretrainZero: Reinforcement Active Pretraining' 논문에 대한 자세한 리뷰입니다.2025년 12월 4일
[논문리뷰] OneThinker: All-in-one Reasoning Model for Image and VideoKaixuan Fan이 [arXiv]에 게시한 'OneThinker: All-in-one Reasoning Model for Image and Video' 논문에 대한 자세한 리뷰입니다.2025년 12월 4일
[논문리뷰] Jina-VLM: Small Multilingual Vision Language Model이 [arXiv]에 게시한 'Jina-VLM: Small Multilingual Vision Language Model' 논문에 대한 자세한 리뷰입니다.2025년 12월 4일
[논문리뷰] In-Context Representation Hijackingyossig이 [arXiv]에 게시한 'In-Context Representation Hijacking' 논문에 대한 자세한 리뷰입니다.2025년 12월 4일