[논문리뷰] AnyTalker: Scaling Multi-Person Talking Video Generation with Interactivity RefinementYicheng Ji이 [arXiv]에 게시한 'AnyTalker: Scaling Multi-Person Talking Video Generation with Interactivity Refinement' 논문에 대한 자세한 리뷰입니다.2025년 12월 1일
[논문리뷰] What does it mean to understand language?이 [arXiv]에 게시한 'What does it mean to understand language?' 논문에 대한 자세한 리뷰입니다.2025년 11월 28일
[논문리뷰] Video Generation Models Are Good Latent Reward Models이 [arXiv]에 게시한 'Video Generation Models Are Good Latent Reward Models' 논문에 대한 자세한 리뷰입니다.2025년 11월 28일
[논문리뷰] Multi-Crit: Benchmarking Multimodal Judges on Pluralistic Criteria-Following이 [arXiv]에 게시한 'Multi-Crit: Benchmarking Multimodal Judges on Pluralistic Criteria-Following' 논문에 대한 자세한 리뷰입니다.2025년 11월 28일
[논문리뷰] MIRA: Multimodal Iterative Reasoning Agent for Image EditingJiebo Luo이 [arXiv]에 게시한 'MIRA: Multimodal Iterative Reasoning Agent for Image Editing' 논문에 대한 자세한 리뷰입니다.2025년 11월 28일
[논문리뷰] Canvas-to-Image: Compositional Image Generation with Multimodal ControlsKfir Aberman이 [arXiv]에 게시한 'Canvas-to-Image: Compositional Image Generation with Multimodal Controls' 논문에 대한 자세한 리뷰입니다.2025년 11월 28일
[논문리뷰] Agentic Learner with Grow-and-Refine Multimodal Semantic MemoryQunyi Xie이 [arXiv]에 게시한 'Agentic Learner with Grow-and-Refine Multimodal Semantic Memory' 논문에 대한 자세한 리뷰입니다.2025년 11월 28일
[논문리뷰] Terminal Velocity MatchingJiaming Song이 [arXiv]에 게시한 'Terminal Velocity Matching' 논문에 대한 자세한 리뷰입니다.2025년 11월 27일
[논문리뷰] SPHINX: A Synthetic Environment for Visual Perception and ReasoningNidhi Rastogi이 [arXiv]에 게시한 'SPHINX: A Synthetic Environment for Visual Perception and Reasoning' 논문에 대한 자세한 리뷰입니다.2025년 11월 27일
[논문리뷰] Revisiting Generalization Across Difficulty Levels: It's Not So Easy이 [arXiv]에 게시한 'Revisiting Generalization Across Difficulty Levels: It's Not So Easy' 논문에 대한 자세한 리뷰입니다.2025년 11월 27일
[논문리뷰] RAISECity: A Multimodal Agent Framework for Reality-Aligned 3D World Generation at City-ScaleYangcheng Yu이 [arXiv]에 게시한 'RAISECity: A Multimodal Agent Framework for Reality-Aligned 3D World Generation at City-Scale' 논문에 대한 자세한 리뷰입니다.2025년 11월 27일
[논문리뷰] NVIDIA Nemotron Parse 1.1이 [arXiv]에 게시한 'NVIDIA Nemotron Parse 1.1' 논문에 대한 자세한 리뷰입니다.2025년 11월 27일
[논문리뷰] Monet: Reasoning in Latent Visual Space Beyond Images and LanguagePengfei Wan이 [arXiv]에 게시한 'Monet: Reasoning in Latent Visual Space Beyond Images and Language' 논문에 대한 자세한 리뷰입니다.2025년 11월 27일
[논문리뷰] MobileVLA-R1: Reinforcing Vision-Language-Action for Mobile RobotsRui Yang이 [arXiv]에 게시한 'MobileVLA-R1: Reinforcing Vision-Language-Action for Mobile Robots' 논문에 대한 자세한 리뷰입니다.2025년 11월 27일
[논문리뷰] Latent Collaboration in Multi-Agent Systems이 [arXiv]에 게시한 'Latent Collaboration in Multi-Agent Systems' 논문에 대한 자세한 리뷰입니다.2025년 11월 27일
[논문리뷰] Inferix: A Block-Diffusion based Next-Generation Inference Engine for World SimulationJiahao He이 [arXiv]에 게시한 'Inferix: A Block-Diffusion based Next-Generation Inference Engine for World Simulation' 논문에 대한 자세한 리뷰입니다.2025년 11월 27일
[논문리뷰] Image-Free Timestep Distillation via Continuous-Time Consistency with Trajectory-Sampled PairsXin Yang이 [arXiv]에 게시한 'Image-Free Timestep Distillation via Continuous-Time Consistency with Trajectory-Sampled Pairs' 논문에 대한 자세한 리뷰입니다.2025년 11월 27일
[논문리뷰] I-GLIDE: Input Groups for Latent Health Indicators in Degradation Estimation이 [arXiv]에 게시한 'I-GLIDE: Input Groups for Latent Health Indicators in Degradation Estimation' 논문에 대한 자세한 리뷰입니다.2025년 11월 27일
[논문리뷰] Harmony: Harmonizing Audio and Video Generation through Cross-Task Synergy이 [arXiv]에 게시한 'Harmony: Harmonizing Audio and Video Generation through Cross-Task Synergy' 논문에 대한 자세한 리뷰입니다.2025년 11월 27일