[논문리뷰] Video Streaming Thinking: VideoLLMs Can Watch and Think SimultaneouslyarXiv에 게시된 'Video Streaming Thinking: VideoLLMs Can Watch and Think Simultaneously' 논문에 대한 자세한 리뷰입니다.#Review#Streaming Video Understanding#VideoLLMs#Chain-of-Thought (CoT)#Real-time AI#Reinforcement Learning#Knowledge Graphs#Streaming Thinking#Low Latency2026년 3월 15일댓글 수 로딩 중
[논문리뷰] VQQA: An Agentic Approach for Video Evaluation and Quality ImprovementarXiv에 게시된 'VQQA: An Agentic Approach for Video Evaluation and Quality Improvement' 논문에 대한 자세한 리뷰입니다.#Review2026년 3월 15일댓글 수 로딩 중
[논문리뷰] V-Bridge: Bridging Video Generative Priors to Versatile Few-shot Image RestorationJunpeng Jiang이 arXiv에 게시한 'V-Bridge: Bridging Video Generative Priors to Versatile Few-shot Image Restoration' 논문에 대한 자세한 리뷰입니다.#Review2026년 3월 15일댓글 수 로딩 중
[논문리뷰] Think While Watching: Online Streaming Segment-Level Memory for Multi-Turn Video Reasoning in Multimodal Large Language ModelsKang Liu이 arXiv에 게시한 'Think While Watching: Online Streaming Segment-Level Memory for Multi-Turn Video Reasoning in Multimodal Large Language Models' 논문에 대한 자세한 리뷰입니다.#Review#Streaming Video Reasoning#Multi-Turn Interaction#Segment-Level Memory#Causal Mask#Positional Encoding#Dual KV Cache#Multimodal Large Language Models2026년 3월 15일댓글 수 로딩 중
[논문리뷰] Steve-Evolving: Open-World Embodied Self-Evolution via Fine-Grained Diagnosis and Dual-Track Knowledge DistillationChenglong Li이 arXiv에 게시한 'Steve-Evolving: Open-World Embodied Self-Evolution via Fine-Grained Diagnosis and Dual-Track Knowledge Distillation' 논문에 대한 자세한 리뷰입니다.#Review2026년 3월 15일댓글 수 로딩 중
[논문리뷰] Spend Less, Reason Better: Budget-Aware Value Tree Search for LLM AgentsXiaoxiao Li이 arXiv에 게시한 'Spend Less, Reason Better: Budget-Aware Value Tree Search for LLM Agents' 논문에 대한 자세한 리뷰입니다.#Review2026년 3월 15일댓글 수 로딩 중
[논문리뷰] SimRecon: SimReady Compositional Scene Reconstruction from Real VideosKai Zhu이 arXiv에 게시한 'SimRecon: SimReady Compositional Scene Reconstruction from Real Videos' 논문에 대한 자세한 리뷰입니다.#Review#Compositional 3D Scene Reconstruction#Simulation-Ready Scenes#Active Viewpoint Optimization (AVO)#Scene Graph Synthesizer (SGS)#Real-world Videos#Physical Plausibility2026년 3월 15일댓글 수 로딩 중
[논문리뷰] OmniForcing: Unleashing Real-time Joint Audio-Visual GenerationJie Huang이 arXiv에 게시한 'OmniForcing: Unleashing Real-time Joint Audio-Visual Generation' 논문에 대한 자세한 리뷰입니다.#Review#Streaming Audio-Visual Generation#Diffusion Distillation#Autoregressive Video Synthesis#Multi-modal AI2026년 3월 15일댓글 수 로딩 중
[논문리뷰] Multimodal OCR: Parse Anything from DocumentsLiang Xin이 arXiv에 게시한 'Multimodal OCR: Parse Anything from Documents' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal OCR#MOCR#Document Parsing#Structured Graphics#Image-to-SVG#Vision-Language Models#OCR Arena2026년 3월 15일댓글 수 로딩 중
[논문리뷰] MM-CondChain: A Programmatically Verified Benchmark for Visually Grounded Deep Compositional ReasoningarXiv에 게시된 'MM-CondChain: A Programmatically Verified Benchmark for Visually Grounded Deep Compositional Reasoning' 논문에 대한 자세한 리뷰입니다.#Review#MLLM#Deep Compositional Reasoning#Programmatically Verified Benchmark#Hard Negatives#Control Flow#VPIR#Path F12026년 3월 15일댓글 수 로딩 중
[논문리뷰] LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without GenerationarXiv에 게시된 'LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation' 논문에 대한 자세한 리뷰입니다.#Review#KV Cache Eviction#Long Context LLM#Attention Score Prediction#LoRA#Parameter-Efficient#Time-to-First-Token2026년 3월 15일댓글 수 로딩 중
[논문리뷰] LMEB: Long-horizon Memory Embedding BenchmarkarXiv에 게시된 'LMEB: Long-horizon Memory Embedding Benchmark' 논문에 대한 자세한 리뷰입니다.#Review#Memory Embeddings#Long-horizon Memory Retrieval#Text Embedding Benchmarks#Episodic Memory#Dialogue Memory#Semantic Memory#Procedural Memory#Zero-Shot Evaluation2026년 3월 15일댓글 수 로딩 중
[논문리뷰] HybridStitch: Pixel and Timestep Level Model Stitching for Diffusion AccelerationarXiv에 게시된 'HybridStitch: Pixel and Timestep Level Model Stitching for Diffusion Acceleration' 논문에 대한 자세한 리뷰입니다.#Review#Diffusion model#Mixture of models#Acceleration#Text-to-Image#Model stitching#Latency reduction#Pixel-level#Timestep-level2026년 3월 15일댓글 수 로딩 중
[논문리뷰] HomeSafe-Bench: Evaluating Vision-Language Models on Unsafe Action Detection for Embodied Agents in Household ScenariosarXiv에 게시된 'HomeSafe-Bench: Evaluating Vision-Language Models on Unsafe Action Detection for Embodied Agents in Household Scenarios' 논문에 대한 자세한 리뷰입니다.#Review#Embodied Agents#Unsafe Action Detection#Vision-Language Models (VLMs)#Household Scenarios#HomeSafe-Bench#HD-Guard#Real-time Safety Monitoring2026년 3월 15일댓글 수 로딩 중
[논문리뷰] From Sparse to Dense: Multi-View GRPO for Flow Models via Augmented Condition Spacelindahua이 arXiv에 게시한 'From Sparse to Dense: Multi-View GRPO for Flow Models via Augmented Condition Space' 논문에 대한 자세한 리뷰입니다.#Review#Reinforcement Learning#GRPO#Diffusion Models#Flow Models#Preference Alignment#Condition Enhancement#Multi-View Learning2026년 3월 15일댓글 수 로딩 중
[논문리뷰] ECoLAD: Deployment-Oriented Evaluation for Automotive Time-Series Anomaly DetectionarXiv에 게시된 'ECoLAD: Deployment-Oriented Evaluation for Automotive Time-Series Anomaly Detection' 논문에 대한 자세한 리뷰입니다.#Review#Time-series anomaly detection#Deployment-oriented evaluation#Compute reduction#CPU parallelism#Throughput#Latency#Automotive telemetry#AUC-PR2026년 3월 15일댓글 수 로딩 중
[논문리뷰] Detecting Intrinsic and Instrumental Self-Preservation in Autonomous Agents: The Unified Continuation-Interest ProtocolarXiv에 게시된 'Detecting Intrinsic and Instrumental Self-Preservation in Autonomous Agents: The Unified Continuation-Interest Protocol' 논문에 대한 자세한 리뷰입니다.#Review#AI safety#self-preservation#instrumental convergence#Quantum Boltzmann Machine#entanglement entropy#alignment2026년 3월 15일댓글 수 로딩 중
[논문리뷰] CreativeBench: Benchmarking and Enhancing Machine Creativity via Self-Evolving ChallengesarXiv에 게시된 'CreativeBench: Benchmarking and Enhancing Machine Creativity via Self-Evolving Challenges' 논문에 대한 자세한 리뷰입니다.#Review2026년 3월 15일댓글 수 로딩 중
[논문리뷰] Cheers: Decoupling Patch Details from Semantic Representations Enables Unified Multimodal Comprehension and GenerationYichen Zhang이 arXiv에 게시한 'Cheers: Decoupling Patch Details from Semantic Representations Enables Unified Multimodal Comprehension and Generation' 논문에 대한 자세한 리뷰입니다.#Review#Unified multimodal model#Visual generation and comprehension#Unified vision encoder#Cascaded flow matching#Token compression2026년 3월 15일댓글 수 로딩 중
[논문리뷰] Can Vision-Language Models Solve the Shell Game?arXiv에 게시된 'Can Vision-Language Models Solve the Shell Game?' 논문에 대한 자세한 리뷰입니다.#Review#Visual Entity Tracking#Shell Game#Vision-Language Models (VLMs)#VET-Bench#Spatiotemporal Grounded Chain-of-Thought (SGCoT)#NC1-complete#Transformer-based VLMs2026년 3월 15일댓글 수 로딩 중