[논문리뷰] Code-as-Room: Generating 3D Rooms from Top-Down View Images via Agentic Code Synthesis본 논문은 기존의 text-driven 3D 생성 방식이 갖는 공간적 정보의 불명확성과, 기존 agentic 프레임워크가 holistic room generation 과정에서 직면하는 무한 루프 및 불안정성 문제를 해결하고자 합니다.#Review#Agentic AI#3D Room Synthesis#MLLM#Blender Code#Execution Harness#Cross-stage Memory#Top-down View2026년 5월 18일댓글 수 로딩 중
[논문리뷰] Code as Agent Harness본 논문은 LLM 기반 에이전트 시스템에서 코드가 단순한 생성 대상(target artifact)을 넘어, 시스템의 핵심 운영 인프라로 전환되고 있다는 점을 지적한다.#Review#Agent Harness#Coding Agent#Harness Engineering#Agentic AI#Code-as-Agent-Harness#Executable Verification2026년 5월 18일댓글 수 로딩 중
[논문리뷰] CHI-Bench: Can AI Agents Automate End-to-End, Long-Horizon, Policy-Rich Healthcare Workflows?본 논문은 현대 의료 운영 시스템의 핵심 워크플로우인 사전 승인(Prior Authorization), 이용 관리(Utilization Management), 케어 관리(Care Management)를 자동화하려는 AI 에이전트들의 실질적인 한계를 규명합니다.#Review#Healthcare AI#AI Agents#Policy-Rich Workflows#Long-Horizon#Benchmark#Managed-Care Operations#Model Context Protocol2026년 5월 18일댓글 수 로딩 중
[논문리뷰] AtlasVA: Self-Evolving Visual Skill Memory for Teacher-Free VLM Agents본 연구는 기존 VLM 에이전트가 긴 호흡의 공간적 과업(long-horizon spatial tasks)을 수행할 때 발생하는 '공간적 맹목(spatial blindness)'과 '모달리티 불일치(modality mismatch)' 문제를 해결합니다.#Review#VLM Agents#Visual Skill Memory#Reinforcement Learning#Reward Shaping#Spatial Reasoning#Self-Evolving2026년 5월 18일댓글 수 로딩 중
[논문리뷰] AgentKernelArena: Generalization-Aware Benchmarking of GPU Kernel Optimization Agents본 연구는 GPU 커널 최적화 작업이 딥러닝 시스템의 효율성에 핵심적임에도 불구하고, 기존 벤치마크들이 이를 충분히 포괄하지 못한다는 문제 의식에서 출발합니다.#Review#GPU Kernel Optimization#AI Coding Agents#Generalization#Performance Benchmarking#Triton#HIP#LLM Evaluation2026년 5월 18일댓글 수 로딩 중
[논문리뷰] Agent Bazaar: Enabling Economic Alignment in Multi-Agent Marketplaces본 논문은 LLM 기반의 자율 에이전트가 시장에서 상호작용할 때 발생하는 체계적인 경제적 리스크를 해결하고자 한다. 기존의 AI 정렬 방식은 개별 에이전트의 사실성이나 무해성에만 집중할 뿐, 다수의 에이전트가 상호작용하며 만드는 시장 수준의 불안정성을 제어하지 못한다.#Review#Multi-Agent Systems#Economic Alignment#Large Language Models#Simulation Framework#Market Stability#Reinforcement Learning2026년 5월 18일댓글 수 로딩 중
[논문리뷰] Actionable World Representation본 논문은 물리 세계의 역학을 효과적으로 modeling하고 제어할 수 있는, 신뢰성 있는 디지털 트윈(Digital Twin)을 구축하는 문제를 해결하고자 합니다.#Review#Physical World Models#Digital Twin#Neural Implicit Representation#Actionable Representation#Deformation Modeling2026년 5월 18일댓글 수 로딩 중
[논문리뷰] AI for Auto-Research: Roadmap & User Guide본 논문은 AI가 연구의 전 과정을 자동화할 수 있는 단계에 이르렀으나, 이로 인해 발생하는 심각한 연구 무결성(Integrity) 문제를 해결하고자 합니다.#Review#AI-assisted research#Research Lifecycle#Autonomous Agents#Scientific Integrity#End-to-End Analysis#Research Integrity2026년 5월 18일댓글 수 로딩 중
[논문리뷰] A2RBench: An Automatic Paradigm for Formally Verifiable Abstract Reasoning Benchmark Generation현재 Large Language Models (LLM)의 추상적 추론 능력 평가는 진정한 추론 요구와 벤치마크 확장성 사이의 근본적인 trade-off에 직면해 있다.#Review#Abstract Reasoning#LLM Evaluation#Cycle Consistency#Benchmark Generation#Formal Verification#Task Expansion#Cognitive Analysis2026년 5월 18일댓글 수 로딩 중
[논문리뷰] WorldAct: Activating Monolithic 3D Worlds into Interactive-Ready Object-Centric Scenes본 논문은 최신 3D generative world model들이 생성한 장면의 정적인 특성과 낮은 편집 가능성 문제를 해결하기 위해 WorldAct를 제안합니다.#Review#3D Gaussian Splatting#Scene Decomposition#Agent-Driven Interaction#3D World Modeling#Embodied Simulation#Interactive Content Creation2026년 5월 17일댓글 수 로딩 중
[논문리뷰] Unlocking Dense Metric Depth Estimation in VLMs본 논문은 기존 VLMs가 2D 과업에는 뛰어나지만 3D 이해 능력은 여전히 제한적이라는 핵심 문제에서 출발합니다 . 기존 연구들은 외부의 3D 전문 모델로부터 지식을 증류하거나, 텍스트 기반으로만 학습하여 정밀한 기하학적 정보가 부족하고 오류가 누적되는 한계를 보입니다.#Review#Vision-Language Models#Dense Metric Depth Estimation#3D Geometry#Unified Supervision#Spatial Reasoning2026년 5월 17일댓글 수 로딩 중
[논문리뷰] Steered LLM Activations are Non-Surjective본 연구는 Activation Steering이 유도하는 모델의 내부 행동 변화가 실제 텍스트 프롬프트를 통해서도 동일하게 구현 가능한지라는 근본적인 의문을 해결하고자 합니다.#Review#Activation Steering#Surjectivity#LLM Interpretability#Prompt-Reachability#White-box Intervention#AI Safety2026년 5월 17일댓글 수 로딩 중
[논문리뷰] Sparse Autoencoders enable Robust and Interpretable Fine-tuning of CLIP models본 논문은 CLIP과 같은 대규모 vision-language 모델을 하위 태스크(downstream task)에 맞게 fine-tuning할 때 발생하는 OOD(Out-of-Distribution) 성능 저하 문제를 해결하고자 한다.#Review#CLIP#Sparse Autoencoders#Robust Fine-tuning#Interpretability#Representational Drift#Computer Vision2026년 5월 17일댓글 수 로딩 중
[논문리뷰] Solvita: Enhancing Large Language Models for Competitive Programming via Agentic Evolution본 논문은 기존 LLM 기반 경쟁 프로그래밍 에이전트들이 가진 상태 비저장(stateless) 구조의 한계를 해결하고자 합니다. 대다수의 최신 프레임워크는 문제 해결 시마다 처음부터 시작하며, 과거의 디버깅 경험이나 실패 기록을 재사용하지 못하는 고립된 구조를 띱니다 .#Review#Large Language Models#Competitive Programming#Agentic Evolution#Reinforcement Learning#Knowledge Network#Code Generation#Multi-Agent System2026년 5월 17일댓글 수 로딩 중
[논문리뷰] ReactiveGWM: Steering NPC in Reactive Game World Models본 논문은 기존의 Game World Models가 NPC를 단순한 배경 요소로 취급하여 상호작용이 결여된 정적인 비디오 렌더러에 머물러 있는 문제를 해결하고자 합니다.#Review#Game World Models#NPC#Controllable Video Generation#Diffusion Models#Strategy Transfer#Cross-Attention#Interaction Logic2026년 5월 17일댓글 수 로딩 중
[논문리뷰] PhysBrain 1.0 Technical Report본 논문은 기존 VLA 시스템이 의존하는 플랫폼 종속적인 로봇 궤적(Trajectory) 데이터 수집의 한계를 극복하고, 물리적 환경에 대한 근본적인 이해(Physical Commonsense)를 확보하는 것을 목표로 합니다.#Review#Vision-Language-Action Models#Embodied Intelligence#Physical Commonsense#Egocentric Video#Data Engine#VLA Adaptation2026년 5월 17일댓글 수 로딩 중
[논문리뷰] PAGER: Bridging the Semantic-Execution Gap in Point-Precise Geometric GUI Control본 연구는 기존 GUI 에이전트들이 주로 의존하는 'region-tolerant' 패러다임이 정밀한 기하학적 구성 작업에서 실패하는 근본적인 문제를 해결하고자 한다.#Review#GUI Agents#Geometric Reasoning#Precision-Sensitive#Dependency-Structured Planning#Pixel-Grounded Supervised Tuning#Reinforcement Learning#Semantic-Execution Gap2026년 5월 17일댓글 수 로딩 중
[논문리뷰] OmniHumanoid: Streaming Cross-Embodiment Video Generation with Paired-Free Adaptation본 연구는 로봇 학습을 위한 고품질 데이터 수집의 높은 비용과 확장성 문제를 해결하기 위해, 다양한 humanoid embodiment 간의 cross-embodiment video generation을 수행하고자 합니다.#Review#Cross-embodiment Video Generation#Diffusion Transformer#Embodiment-specific Adaptation#Streaming Inference#Paired-free Learning2026년 5월 17일댓글 수 로딩 중
[논문리뷰] Nudging Beyond the Comfort Zone: Efficient Strategy-Guided Exploration for RLVR본 논문은 RLVR 환경에서 고질적인 문제인 탐색의 병목 현상을 해결하고자 합니다. 기존 방식은 탐색 효율을 높이기 위해 샘플링 횟수(Rollout)를 무작정 늘리는 방식을 취하지만, 이는 계산 비용이 극심하고 long-tail에 위치한 희귀한 정답 추론 경로를 발견하는 데 한계가 있습니다 .#Review#RLVR#Reinforcement Learning#Exploration#LLM Reasoning#Strategy Nudging#Inter-Intra Group Advantage#Distillation2026년 5월 17일댓글 수 로딩 중
[논문리뷰] MobileEgo Anywhere: Open Infrastructure for long horizon egocentric data on commodity hardware본 논문은 대규모 VLA 모델 학습에 필수적인 장기 시점(long horizon)의 egocentric 데이터를 수집하기 위한 개방형 인프라를 구축하는 데 목적이 있습니다. 기존 데이터셋은 에피소드 길이가 짧고 고가의 하드웨어 장비에 의존해야 하는 등 확장성에 한계를 보입니다.#Review#Egocentric Data#Vision Language Action (VLA)#Long-horizon#SLAM#STERA#Smartphone-based Capture2026년 5월 17일댓글 수 로딩 중