[논문리뷰] From Narrow to Panoramic Vision: Attention-Guided Cold-Start Reshapes Multimodal ReasoningarXiv에 게시된 'From Narrow to Panoramic Vision: Attention-Guided Cold-Start Reshapes Multimodal Reasoning' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal Reasoning#Cold-Start Initialization#Attention Mechanism#Visual Grounding#Large Multimodal Models (LMMs)#Reinforcement Learning (RLHF)#Data Synthesis#Visual Attention Score (VAS)2026년 3월 9일댓글 수 로딩 중
[논문리뷰] FVG-PT: Adaptive Foreground View-Guided Prompt Tuning for Vision-Language ModelsarXiv에 게시된 'FVG-PT: Adaptive Foreground View-Guided Prompt Tuning for Vision-Language Models' 논문에 대한 자세한 리뷰입니다.#Review#Vision-Language Models#Prompt Tuning#Foreground Attention#Adaptive Learning#Generalization#Base-to-New Trade-off#Attention Guidance2026년 3월 9일댓글 수 로딩 중
[논문리뷰] CoCo: Code as CoT for Text-to-Image Preview and Rare Concept GenerationHuanyu Zhang이 arXiv에 게시한 'CoCo: Code as CoT for Text-to-Image Preview and Rare Concept Generation' 논문에 대한 자세한 리뷰입니다.#Review#Text-to-Image Generation#Chain-of-Thought#Code Generation#Multimodal Large Language Models#Structured Image Synthesis#Draft-Guided Refinement#Visual Reasoning2026년 3월 9일댓글 수 로딩 중
[논문리뷰] CARE-Edit: Condition-Aware Routing of Experts for Contextual Image EditingDan Xu이 arXiv에 게시한 'CARE-Edit: Condition-Aware Routing of Experts for Contextual Image Editing' 논문에 대한 자세한 리뷰입니다.#Review#Image Editing#Diffusion Models#Mixture-of-Experts (MoE)#Condition-Aware Routing#Contextual Image Editing#Mask Repaint#Latent Mixture#Diffusion Transformer2026년 3월 9일댓글 수 로딩 중
[논문리뷰] Believe Your Model: Distribution-Guided Confidence CalibrationMofei Song이 arXiv에 게시한 'Believe Your Model: Distribution-Guided Confidence Calibration' 논문에 대한 자세한 리뷰입니다.#Review#Confidence Calibration#Test-Time Scaling#Large Reasoning Models (LRMs)#Gaussian Mixture Models (GMM)#Hierarchical Voting#Self-Reflection#Distributional Priors2026년 3월 9일댓글 수 로딩 중
[논문리뷰] Agentic Critical TrainingXiyao Wang이 arXiv에 게시한 'Agentic Critical Training' 논문에 대한 자세한 리뷰입니다.#Review#LLM Agents#Reinforcement Learning#Imitation Learning#Self-Reflection#Action Quality#Out-of-Distribution Generalization#Critical Reasoning#GRPO2026년 3월 9일댓글 수 로딩 중
[논문리뷰] π-StepNFT: Wider Space Needs Finer Steps in Online RL for Flow-based VLAsarXiv에 게시된 'π-StepNFT: Wider Space Needs Finer Steps in Online RL for Flow-based VLAs' 논문에 대한 자세한 리뷰입니다.#Review#Reinforcement Learning (RL)#Flow-based Models#Vision-Language-Action (VLA) Models#Online Learning#Stochastic Differential Equation (SDE)#Contrastive Learning#Embodied AI#Robotics2026년 3월 8일댓글 수 로딩 중
[논문리뷰] WorldCache: Accelerating World Models for Free via Heterogeneous Token CachingMingqiang Wu이 arXiv에 게시한 'WorldCache: Accelerating World Models for Free via Heterogeneous Token Caching' 논문에 대한 자세한 리뷰입니다.#Review#World Models#Diffusion Models#Inference Acceleration#Feature Caching#Heterogeneous Tokens#Curvature Prediction#Adaptive Skipping2026년 3월 8일댓글 수 로딩 중
[논문리뷰] WildActor: Unconstrained Identity-Preserving Video GenerationFei Shen이 arXiv에 게시한 'WildActor: Unconstrained Identity-Preserving Video Generation' 논문에 대한 자세한 리뷰입니다.#Review#Video Generation#Identity Preservation#Human-Centric Video#Large-scale Dataset#Diffusion Models#Attention Mechanism#Viewpoint Consistency2026년 3월 8일댓글 수 로딩 중
[논문리뷰] SLER-IR: Spherical Layer-wise Expert Routing for All-in-One Image RestorationDizhe Zhang이 arXiv에 게시한 'SLER-IR: Spherical Layer-wise Expert Routing for All-in-One Image Restoration' 논문에 대한 자세한 리뷰입니다.#Review#Image Restoration#Mixture of Experts#Degradation Representation#Spherical Embedding#Contrastive Learning#Adaptive Routing#All-in-One Model#Global-Local Fusion2026년 3월 8일댓글 수 로딩 중
[논문리뷰] RoboMME: Benchmarking and Understanding Memory for Robotic Generalist PoliciesHaoran Zhang이 arXiv에 게시한 'RoboMME: Benchmarking and Understanding Memory for Robotic Generalist Policies' 논문에 대한 자세한 리뷰입니다.#Review#Robotics#Memory#Benchmark#Manipulation#Vision-Language-Action Models#Temporal Memory#Spatial Memory#Procedural Memory2026년 3월 8일댓글 수 로딩 중
[논문리뷰] Reasoning Models Struggle to Control their Chains of ThoughtarXiv에 게시된 'Reasoning Models Struggle to Control their Chains of Thought' 논문에 대한 자세한 리뷰입니다.#Review#Chain-of-Thought (CoT)#Model Controllability#AI Safety#Monitorability#Large Language Models (LLMs)#Reinforcement Learning (RL)#Evaluation Suite2026년 3월 8일댓글 수 로딩 중
[논문리뷰] Progressive Residual Warmup for Language Model PretrainingYang Wang이 arXiv에 게시한 'Progressive Residual Warmup for Language Model Pretraining' 논문에 대한 자세한 리뷰입니다.#Review#Large Language Models (LLMs)#Transformer#Pretraining Stability#Residual Connections#Warmup Schedule#Layer-wise Learning#Optimization2026년 3월 8일댓글 수 로딩 중
[논문리뷰] Planning in 8 Tokens: A Compact Discrete Tokenizer for Latent World ModelSuha Kwak이 arXiv에 게시한 'Planning in 8 Tokens: A Compact Discrete Tokenizer for Latent World Model' 논문에 대한 자세한 리뷰입니다.#Review#World Model#Discrete Tokenizer#Latent Representation#Action Planning#Model Predictive Control#Real-time AI#Compression#Vision Foundation Model2026년 3월 8일댓글 수 로딩 중
[논문리뷰] PixARMesh: Autoregressive Mesh-Native Single-View Scene ReconstructionarXiv에 게시된 'PixARMesh: Autoregressive Mesh-Native Single-View Scene Reconstruction' 논문에 대한 자세한 리뷰입니다.#Review#Single-View 3D Reconstruction#Autoregressive Models#Mesh Generation#Scene Understanding#Transformer#Point Cloud Features#Pose Estimation2026년 3월 8일댓글 수 로딩 중
[논문리뷰] Physical Simulator In-the-Loop Video GenerationThabo Beeler이 arXiv에 게시한 'Physical Simulator In-the-Loop Video Generation' 논문에 대한 자세한 리뷰입니다.#Review#Video Generation#Physical Simulation#Diffusion Models#Texture Consistency#Motion Controllability#Test-Time Optimization#4D Reconstruction2026년 3월 8일댓글 수 로딩 중
[논문리뷰] Penguin-VL: Exploring the Efficiency Limits of VLM with LLM-based Vision EncodersarXiv에 게시된 'Penguin-VL: Exploring the Efficiency Limits of VLM with LLM-based Vision Encoders' 논문에 대한 자세한 리뷰입니다.#Review#Vision Language Model (VLM)#LLM-based Vision Encoder#Efficient AI#Multimodal Understanding#Generative Pretraining#Resource-constrained Deployment#Temporal Reasoning2026년 3월 8일댓글 수 로딩 중
[논문리뷰] Mario: Multimodal Graph Reasoning with Large Language ModelsarXiv에 게시된 'Mario: Multimodal Graph Reasoning with Large Language Models' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal Graph#Large Language Models#Graph Reasoning#Cross-Modal Alignment#Modality Adaptation#Instruction Tuning#Vision-Language Model#Node Classification2026년 3월 8일댓글 수 로딩 중
[논문리뷰] Making Reconstruction FID Predictive of Diffusion Generation FIDHaotian Zhang이 arXiv에 게시한 'Making Reconstruction FID Predictive of Diffusion Generation FID' 논문에 대한 자세한 리뷰입니다.#Review#Latent Diffusion Models#VAE#FID#Generative Models#Evaluation Metrics#Image Generation#Reconstruction-Generation Dilemma#Interpolation2026년 3월 8일댓글 수 로딩 중
[논문리뷰] Layer by layer, module by module: Choose both for optimal OOD probing of ViTIevgen Redko이 arXiv에 게시한 'Layer by layer, module by module: Choose both for optimal OOD probing of ViT' 논문에 대한 자세한 리뷰입니다.#Review#Vision Transformer#Out-of-Distribution#Linear Probing#Distribution Shift#Foundation Models#Intermediate Layers#Module Analysis2026년 3월 8일댓글 수 로딩 중