[논문리뷰] Compositional Generalization Requires Linear, Orthogonal Representations in Vision Embedding ModelsSeong Joon Oh이 arXiv에 게시한 'Compositional Generalization Requires Linear, Orthogonal Representations in Vision Embedding Models' 논문에 대한 자세한 리뷰입니다.#Review#Compositional Generalization#Vision-Language Models#Linear Representations#Orthogonal Representations#Neural Networks#Embedding Geometry#CLIP2026년 3월 1일댓글 수 로딩 중
[논문리뷰] CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM EraarXiv에 게시된 'CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era' 논문에 대한 자세한 리뷰입니다.#Review#LLM Hallucination#Citation Verification#Multi-Agent System#Benchmark#Fact Checking#Scientific Integrity#Information Retrieval#Qwen3-VL2026년 3월 1일댓글 수 로딩 중
[논문리뷰] CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel GenerationarXiv에 게시된 'CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel Generation' 논문에 대한 자세한 리뷰입니다.#Review#CUDA Kernel Generation#Agentic Reinforcement Learning#Large Language Models (LLMs)#GPU Optimization#Performance Tuning#Deep Learning Infrastructure#Program Synthesis2026년 3월 1일댓글 수 로딩 중
[논문리뷰] Accelerating Masked Image Generation by Learning Latent Controlled DynamicsXiaohui Li이 arXiv에 게시한 'Accelerating Masked Image Generation by Learning Latent Controlled Dynamics' 논문에 대한 자세한 리뷰입니다.#Review#Masked Image Generation#Model Acceleration#Latent Dynamics Learning#Feature Prediction#Transformer Efficiency#Image Synthesis2026년 3월 1일댓글 수 로딩 중
[논문리뷰] veScale-FSDP: Flexible and High-Performance FSDP at ScaleCong Xie이 arXiv에 게시한 'veScale-FSDP: Flexible and High-Performance FSDP at Scale' 논문에 대한 자세한 리뷰입니다.#Review#FSDP#Distributed Training#LLM#GPU Scaling#Memory Optimization#Performance Optimization#Structure-Aware Training#RaggedShard2026년 2월 26일댓글 수 로딩 중
[논문리뷰] The Trinity of Consistency as a Defining Principle for General World ModelsarXiv에 게시된 'The Trinity of Consistency as a Defining Principle for General World Models' 논문에 대한 자세한 리뷰입니다.#Review#World Models#Multimodal Generative AI#Consistency Theory#Spatial-Temporal Reasoning#Causal Simulation#AI Benchmarking#Artificial General Intelligence2026년 2월 26일댓글 수 로딩 중
[논문리뷰] Search More, Think Less: Rethinking Long-Horizon Agentic Search for Efficiency and GeneralizationarXiv에 게시된 'Search More, Think Less: Rethinking Long-Horizon Agentic Search for Efficiency and Generalization' 논문에 대한 자세한 리뷰입니다.#Review#Agentic AI#Long-Horizon Search#Parallel Execution#Data Synthesis#Reinforcement Learning#Generalization#Efficiency#LLM Agent2026년 2월 26일댓글 수 로딩 중
[논문리뷰] Risk-Aware World Model Predictive Control for Generalizable End-to-End Autonomous DrivingJian-Fang Hu이 arXiv에 게시한 'Risk-Aware World Model Predictive Control for Generalizable End-to-End Autonomous Driving' 논문에 대한 자세한 리뷰입니다.#Review#End-to-End Autonomous Driving#World Model Predictive Control#Risk-Aware#Generalization#Self-Supervised Learning#Scenario Exploration#Autonomous Systems2026년 2월 26일댓글 수 로딩 중
[논문리뷰] OmniGAIA: Towards Native Omni-Modal AI AgentsGuanting Dong이 arXiv에 게시한 'OmniGAIA: Towards Native Omni-Modal AI Agents' 논문에 대한 자세한 리뷰입니다.#Review#Omni-modal AI#Multi-modal Agents#Tool-Integrated Reasoning#Benchmark#Event Graph#Active Perception#Trajectory Synthesis#DPO2026년 2월 26일댓글 수 로딩 중
[논문리뷰] MobilityBench: A Benchmark for Evaluating Route-Planning Agents in Real-World Mobility ScenariosarXiv에 게시된 'MobilityBench: A Benchmark for Evaluating Route-Planning Agents in Real-World Mobility Scenarios' 논문에 대한 자세한 리뷰입니다.#Review#Large Language Models#Route Planning Agents#Benchmarking#Real-World Mobility#API Replay Sandbox#Multi-dimensional Evaluation#Tool-augmented Agents2026년 2월 26일댓글 수 로딩 중
[논문리뷰] MediX-R1: Open Ended Medical Reinforcement LearningarXiv에 게시된 'MediX-R1: Open Ended Medical Reinforcement Learning' 논문에 대한 자세한 리뷰입니다.#Review#Reinforcement Learning#Multimodal LLMs#Medical AI#Composite Reward#LLM-as-a-Judge#Open-ended Generation#Medical Imaging2026년 2월 26일댓글 수 로딩 중
[논문리뷰] Imagination Helps Visual Reasoning, But Not Yet in Latent SpacearXiv에 게시된 'Imagination Helps Visual Reasoning, But Not Yet in Latent Space' 논문에 대한 자세한 리뷰입니다.#Review#Visual Reasoning#Latent Space#Causal Mediation Analysis#Multimodal LLMs#Textual Imagination#Model Interpretation#Latent Tokens2026년 2월 26일댓글 수 로딩 중
[논문리뷰] GeoWorld: Geometric World ModelsRichard Hartley이 arXiv에 게시한 'GeoWorld: Geometric World Models' 논문에 대한 자세한 리뷰입니다.#Review#Geometric World Models#Hyperbolic Geometry#Joint-Embedding Predictive Architectures (JEPA)#Reinforcement Learning (RL)#Multi-step Planning#Visual Planning#Energy-Based Models2026년 2월 26일댓글 수 로딩 중
[논문리뷰] From Blind Spots to Gains: Diagnostic-Driven Iterative Training for Large Multimodal ModelsWei Ye이 arXiv에 게시한 'From Blind Spots to Gains: Diagnostic-Driven Iterative Training for Large Multimodal Models' 논문에 대한 자세한 리뷰입니다.#Review#Large Multimodal Models#Iterative Training#Diagnostic-Driven Learning#Reinforcement Learning#Multimodal Reasoning#Data Generation#Agent Systems2026년 2월 26일댓글 수 로딩 중
[논문리뷰] Exploratory Memory-Augmented LLM Agent via Hybrid On- and Off-Policy OptimizationarXiv에 게시된 'Exploratory Memory-Augmented LLM Agent via Hybrid On- and Off-Policy Optimization' 논문에 대한 자세한 리뷰입니다.#Review#LLM Agents#Reinforcement Learning#Exploration#Memory Augmentation#Hybrid RL#On-Policy Optimization#Off-Policy Optimization2026년 2월 26일댓글 수 로딩 중
[논문리뷰] EmbodMocap: In-the-Wild 4D Human-Scene Reconstruction for Embodied AgentsXuqian Ren이 arXiv에 게시한 'EmbodMocap: In-the-Wild 4D Human-Scene Reconstruction for Embodied Agents' 논문에 대한 자세한 리뷰입니다.#Review#Embodied AI#4D Reconstruction#Human-Scene Interaction#iPhone RGB-D#In-the-Wild Mocap#Physics-based Animation#Humanoid Robot Control#Low-Cost Data Collection2026년 2월 26일댓글 수 로딩 중
[논문리뷰] Efficient Continual Learning in Language Models via Thalamically Routed Cortical ColumnsAfshin Khadangi이 arXiv에 게시한 'Efficient Continual Learning in Language Models via Thalamically Routed Cortical Columns' 논문에 대한 자세한 리뷰입니다.#Review#Continual Learning#Language Models#Sparse Routing#Cortical Columns#Thalamic Routing#Catastrophic Forgetting#Stability-Plasticity2026년 2월 26일댓글 수 로딩 중
[논문리뷰] Echoes Over Time: Unlocking Length Generalization in Video-to-Audio Generation ModelsarXiv에 게시된 'Echoes Over Time: Unlocking Length Generalization in Video-to-Audio Generation Models' 논문에 대한 자세한 리뷰입니다.#Review#Video-to-Audio Generation#Length Generalization#Multimodal Learning#Mamba Architecture#Hierarchical Networks#Flow Matching#Audio Synthesis2026년 2월 26일댓글 수 로딩 중
[논문리뷰] DyaDiT: A Multi-Modal Diffusion Transformer for Socially Favorable Dyadic Gesture GenerationHaiyang Liu이 arXiv에 게시한 'DyaDiT: A Multi-Modal Diffusion Transformer for Socially Favorable Dyadic Gesture Generation' 논문에 대한 자세한 리뷰입니다.#Review#Gesture Generation#Diffusion Transformer (DiT)#Multi-Modal#Dyadic Interaction#Socially Aware AI#Orthogonalization Cross Attention#Motion Dictionary2026년 2월 26일댓글 수 로딩 중
[논문리뷰] Causal Motion Diffusion Models for Autoregressive Motion GenerationKent Fujiwara이 arXiv에 게시한 'Causal Motion Diffusion Models for Autoregressive Motion Generation' 논문에 대한 자세한 리뷰입니다.#Review#Motion Generation#Diffusion Models#Autoregressive Models#Causal Modeling#Latent Space#Text-to-Motion#Human Motion Synthesis#Streaming Generation2026년 2월 26일댓글 수 로딩 중