[논문리뷰] HiMu: Hierarchical Multimodal Frame Selection for Long Video Question AnsweringarXiv에 게시된 'HiMu: Hierarchical Multimodal Frame Selection for Long Video Question Answering' 논문에 대한 자세한 리뷰입니다.#Review#Video Question Answering#Frame Selection#Neuro-Symbolic Reasoning#Multimodal Understanding#Long Video2026년 3월 22일댓글 수 로딩 중
[논문리뷰] Helios: Real Real-Time Long Video Generation ModelarXiv에 게시된 'Helios: Real Real-Time Long Video Generation Model' 논문에 대한 자세한 리뷰입니다.#Review#Video Generation#Real-Time#Long Video#Diffusion Transformers#Anti-Drifting#Memory Optimization#Distillation#Autoregressive Models2026년 3월 4일댓글 수 로딩 중
[논문리뷰] SANA-Video: Efficient Video Generation with Block Linear Diffusion TransformerarXiv에 게시된 'SANA-Video: Efficient Video Generation with Block Linear Diffusion Transformer' 논문에 대한 자세한 리뷰입니다.#Review#Video Generation#Diffusion Model#Linear Attention#Transformer#Long Video#Efficient Inference#Constant Memory#Low-Cost Training#RTX Deployment2025년 9월 30일댓글 수 로딩 중