[논문리뷰] Regulating AI AgentsNoam Kolt이 arXiv에 게시한 'Regulating AI Agents' 논문에 대한 자세한 리뷰입니다.#Review#AI agents#EU AI Act#GPAI models#Systemic risk#Self-regulation#Institutional monitoring#AI governance2026년 3월 24일댓글 수 로딩 중
[논문리뷰] RealMaster: Lifting Rendered Scenes into Photorealistic VideoOran Gafni이 arXiv에 게시한 'RealMaster: Lifting Rendered Scenes into Photorealistic Video' 논문에 대한 자세한 리뷰입니다.#Review#Sim-to-Real Translation#Photorealistic Video Generation#Video Diffusion Models#Structural Precision#Global Semantic Transformation#IC-LoRA#Temporal Consistency2026년 3월 24일댓글 수 로딩 중
[논문리뷰] PEARL: Personalized Streaming Video Understanding ModelarXiv에 게시된 'PEARL: Personalized Streaming Video Understanding Model' 논문에 대한 자세한 리뷰입니다.#Review#Personalized Streaming Video Understanding#PSVU#PEARL-Bench#Dual-grained Memory System#Concept-aware Retrieval Algorithm#Vision-Language Models#Real-time AI Assistants2026년 3월 24일댓글 수 로딩 중
[논문리뷰] MultiBind: A Benchmark for Attribute Misbinding in Multi-Subject GenerationQiang Liu이 arXiv에 게시한 'MultiBind: A Benchmark for Attribute Misbinding in Multi-Subject Generation' 논문에 대한 자세한 리뷰입니다.#Review#Multi-subject Generation#Attribute Misbinding#Image Generation#Benchmark#Evaluation Protocol#Deep Learning#Computer Vision2026년 3월 24일댓글 수 로딩 중
[논문리뷰] MinerU-Diffusion: Rethinking Document OCR as Inverse Rendering via Diffusion DecodingWentao Zhang이 arXiv에 게시한 'MinerU-Diffusion: Rethinking Document OCR as Inverse Rendering via Diffusion Decoding' 논문에 대한 자세한 리뷰입니다.#Review#Document OCR#Diffusion Models#Inverse Rendering#Parallel Decoding#Block-Attention#Curriculum Learning#Vision-Language Models2026년 3월 24일댓글 수 로딩 중
[논문리뷰] From Static Templates to Dynamic Runtime Graphs: A Survey of Workflow Optimization for LLM AgentsarXiv에 게시된 'From Static Templates to Dynamic Runtime Graphs: A Survey of Workflow Optimization for LLM Agents' 논문에 대한 자세한 리뷰입니다.#Review#LLM Agents#Workflow Optimization#Agentic Computation Graphs (ACGs)#Static Optimization#Dynamic Optimization#Runtime Adaptation#Evaluation Protocol#Feedback Signals2026년 3월 24일댓글 수 로딩 중
[논문리뷰] Ego2Web: A Web Agent Benchmark Grounded in Egocentric VideosarXiv에 게시된 'Ego2Web: A Web Agent Benchmark Grounded in Egocentric Videos' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal AI Agents#Web-agent Benchmark#Egocentric Video#Visual Grounding#Online Evaluation#LLM-as-a-Judge#Perception-Action Alignment2026년 3월 24일댓글 수 로딩 중
[논문리뷰] DA-Flow: Degradation-Aware Optical Flow Estimation with Diffusion ModelsarXiv에 게시된 'DA-Flow: Degradation-Aware Optical Flow Estimation with Diffusion Models' 논문에 대한 자세한 리뷰입니다.#Review#Optical Flow Estimation#Diffusion Models#Degradation-Aware#Image Restoration#Dense Correspondence#Spatio-Temporal Attention#Hybrid Architecture2026년 3월 24일댓글 수 로딩 중
[논문리뷰] Attend Before Attention: Efficient and Scalable Video Understanding via Autoregressive GazingDavid Eigen이 arXiv에 게시한 'Attend Before Attention: Efficient and Scalable Video Understanding via Autoregressive Gazing' 논문에 대한 자세한 리뷰입니다.#Review#Video Understanding#Multi-modal Large Language Models (MLLMs)#Vision Transformers (ViTs)#Autoregressive Gazing#Token Reduction#Multi-scale Patches#High-Resolution Video#Long-Form Video2026년 3월 24일댓글 수 로딩 중
[논문리뷰] 2Xplat: Two Experts Are Better Than One GeneralistarXiv에 게시된 '2Xplat: Two Experts Are Better Than One Generalist' 논문에 대한 자세한 리뷰입니다.#Review#3D Gaussian Splatting (3DGS)#Pose-free#Feed-forward#Two-Experts Architecture#Geometry Estimation#Appearance Modeling#Novel View Synthesis#Training Efficiency2026년 3월 24일댓글 수 로딩 중
[논문리뷰] WorldCache: Content-Aware Caching for Accelerated Video World ModelsSalman Khan이 arXiv에 게시한 'WorldCache: Content-Aware Caching for Accelerated Video World Models' 논문에 대한 자세한 리뷰입니다.#Review#Diffusion Transformers#Video World Models#Feature Caching#Inference Acceleration#Content-Aware Caching#Motion-Adaptive Caching#Perception-Constrained Caching#Optimal Feature Approximation2026년 3월 23일댓글 수 로딩 중
[논문리뷰] VideoDetective: Clue Hunting via both Extrinsic Query and Intrinsic Relevance for Long Video UnderstandingarXiv에 게시된 'VideoDetective: Clue Hunting via both Extrinsic Query and Intrinsic Relevance for Long Video Understanding' 논문에 대한 자세한 리뷰입니다.#Review#Long Video Understanding#Multimodal Large Language Models#Video Question Answering#Graph Neural Networks#Active Inference#Belief Propagation#Spatio-Temporal Graph2026년 3월 23일댓글 수 로딩 중
[논문리뷰] Speed by Simplicity: A Single-Stream Architecture for Fast Audio-Video Generative Foundation ModelHanwen Sun이 arXiv에 게시한 'Speed by Simplicity: A Single-Stream Architecture for Fast Audio-Video Generative Foundation Model' 논문에 대한 자세한 리뷰입니다.#Review2026년 3월 23일댓글 수 로딩 중
[논문리뷰] SpatialBoost: Enhancing Visual Representation through Language-Guided ReasoningarXiv에 게시된 'SpatialBoost: Enhancing Visual Representation through Language-Guided Reasoning' 논문에 대한 자세한 리뷰입니다.#Review2026년 3월 23일댓글 수 로딩 중
[논문리뷰] Scaling DoRA: High-Rank Adaptation via Factored Norms and Fused Kernelsalexazh이 arXiv에 게시한 'Scaling DoRA: High-Rank Adaptation via Factored Norms and Fused Kernels' 논문에 대한 자세한 리뷰입니다.#Review#DoRA#Low-Rank Adaptation#Parameter-Efficient Fine-Tuning#Fused Kernels#Memory Optimization#Performance Scaling#Triton2026년 3월 23일댓글 수 로딩 중
[논문리뷰] SEM: Sparse Embedding Modulation for Post-Hoc Debiasing of Vision-Language ModelsElisa Ricci이 arXiv에 게시한 'SEM: Sparse Embedding Modulation for Post-Hoc Debiasing of Vision-Language Models' 논문에 대한 자세한 리뷰입니다.#Review#Vision-Language Models#CLIP#Debiasing#Sparse Autoencoder#Post-Hoc#Zero-Shot#Feature Disentanglement#Bias Mitigation2026년 3월 23일댓글 수 로딩 중
[논문리뷰] RoboAlign: Learning Test-Time Reasoning for Language-Action Alignment in Vision-Language-Action ModelsarXiv에 게시된 'RoboAlign: Learning Test-Time Reasoning for Language-Action Alignment in Vision-Language-Action Models' 논문에 대한 자세한 리뷰입니다.#Review#Vision-Language-Action Models (VLAs)#Multimodal-Large-Language Models (MLLMs)#Reinforcement Learning (RL)#Supervised Fine-tuning (SFT)#Embodied Reasoning#Low-level Actions#FAST tokenization#Robotics2026년 3월 23일댓글 수 로딩 중
[논문리뷰] Repurposing Geometric Foundation Models for Multi-view DiffusionarXiv에 게시된 'Repurposing Geometric Foundation Models for Multi-view Diffusion' 논문에 대한 자세한 리뷰입니다.#Review#Geometric Foundation Models#Multi-view Diffusion#Novel View Synthesis (NVS)#Latent Space Design#Geometric Consistency#Diffusion Models#RGB Reconstruction#3D Consistency2026년 3월 23일댓글 수 로딩 중
[논문리뷰] REVERE: Reflective Evolving Research Engineer for Scientific WorkflowsArman Cohan이 arXiv에 게시한 'REVERE: Reflective Evolving Research Engineer for Scientific Workflows' 논문에 대한 자세한 리뷰입니다.#Review#LLM Agents#Self-Adaptation#Research-Coding Workflows#Prompt Optimization#Global Training Context#Code-Based Edits#Continual Learning#Semantic Drift2026년 3월 23일댓글 수 로딩 중
[논문리뷰] PivotRL: High Accuracy Agentic Post-Training at Low Compute CostarXiv에 게시된 'PivotRL: High Accuracy Agentic Post-Training at Low Compute Cost' 논문에 대한 자세한 리뷰입니다.#Review2026년 3월 23일댓글 수 로딩 중