본문으로 건너뛰기

#Video Generation Models

9개의 포스트

[논문리뷰] Which Pretraining Paradigm Better Serves Spatial Intelligence? An Empirical Comparison of Vision-Language and Video Generation Models

댓글 수 로딩 중

[논문리뷰] Generation Models Know Space: Unleashing Implicit 3D Priors for Scene Understanding

댓글 수 로딩 중

[논문리뷰] EmboAlign: Aligning Video Generation with Compositional Constraints for Zero-Shot Manipulation

댓글 수 로딩 중

[논문리뷰] VideoVLA: Video Generators Can Be Generalizable Robot Manipulators

댓글 수 로딩 중

[논문리뷰] Can World Simulators Reason? Gen-ViRe: A Generative Visual Reasoning Benchmark

댓글 수 로딩 중

[논문리뷰] Are Video Models Ready as Zero-Shot Reasoners? An Empirical Study with the MME-CoF Benchmark

댓글 수 로딩 중