최신 포스트

[논문리뷰] EndPrompt: Efficient Long-Context Extension via Terminal Anchoring

본 논문은 LLM의 컨텍스트 윈도우 확장이 요구하는 막대한 계산 자원과 데이터 수집의 어려움을 해결하기 위해 EndPrompt를 제안합니다.

#Review #Long-Context Extension #EndPrompt #Terminal Anchoring #Positional Interpolation #RoPE #Transformer #Sparse Supervision

2026년 5월 18일

[논문리뷰] E-PMQ: Expert-Guided Post-Merge Quantization with Merged-Weight Anchoring

본 논문은 모델 병합(Model Merging) 후 저비트 양자화(Low-bit Quantization)를 적용할 때 발생하는 성능 저하 문제를 해결하고자 합니다.

#Review #Post-Merge Quantization #Model Merging #PTQ #Quantization Deviation #Merged-Weight Anchoring #Expert-Guided Calibration

2026년 5월 18일

[논문리뷰] CompactAttention: Accelerating Chunked Prefill with Block-Union KV Selection

본 논문은 기존 Chunked Prefill 환경에서 Block-Sparse Attention 및 Query-Subsampled KV Selection 방식이 가진 성능 한계를 극복하기 위해 CompactAttention을 제안합니다.

#Review #Chunked Prefill #KV Selection #Block-Sparse Attention #Paged Attention #Zero-Copy Execution #Long-Context LLM

2026년 5월 18일

[논문리뷰] Code-as-Room: Generating 3D Rooms from Top-Down View Images via Agentic Code Synthesis

본 논문은 기존의 text-driven 3D 생성 방식이 갖는 공간적 정보의 불명확성과, 기존 agentic 프레임워크가 holistic room generation 과정에서 직면하는 무한 루프 및 불안정성 문제를 해결하고자 합니다.

#Review #Agentic AI #3D Room Synthesis #MLLM #Blender Code #Execution Harness #Cross-stage Memory #Top-down View

2026년 5월 18일

[논문리뷰] Code as Agent Harness

본 논문은 LLM 기반 에이전트 시스템에서 코드가 단순한 생성 대상(target artifact)을 넘어, 시스템의 핵심 운영 인프라로 전환되고 있다는 점을 지적한다.

#Review #Agent Harness #Coding Agent #Harness Engineering #Agentic AI #Code-as-Agent-Harness #Executable Verification

2026년 5월 18일

[논문리뷰] CHI-Bench: Can AI Agents Automate End-to-End, Long-Horizon, Policy-Rich Healthcare Workflows?

본 논문은 현대 의료 운영 시스템의 핵심 워크플로우인 사전 승인(Prior Authorization), 이용 관리(Utilization Management), 케어 관리(Care Management)를 자동화하려는 AI 에이전트들의 실질적인 한계를 규명합니다.

#Review #Healthcare AI #AI Agents #Policy-Rich Workflows #Long-Horizon #Benchmark #Managed-Care Operations #Model Context Protocol

2026년 5월 18일

[논문리뷰] AtlasVA: Self-Evolving Visual Skill Memory for Teacher-Free VLM Agents

본 연구는 기존 VLM 에이전트가 긴 호흡의 공간적 과업(long-horizon spatial tasks)을 수행할 때 발생하는 '공간적 맹목(spatial blindness)'과 '모달리티 불일치(modality mismatch)' 문제를 해결합니다.

#Review #VLM Agents #Visual Skill Memory #Reinforcement Learning #Reward Shaping #Spatial Reasoning #Self-Evolving

2026년 5월 18일

[논문리뷰] AgentKernelArena: Generalization-Aware Benchmarking of GPU Kernel Optimization Agents

본 연구는 GPU 커널 최적화 작업이 딥러닝 시스템의 효율성에 핵심적임에도 불구하고, 기존 벤치마크들이 이를 충분히 포괄하지 못한다는 문제 의식에서 출발합니다.

#Review #GPU Kernel Optimization #AI Coding Agents #Generalization #Performance Benchmarking #Triton #HIP #LLM Evaluation

2026년 5월 18일

[논문리뷰] Agent Bazaar: Enabling Economic Alignment in Multi-Agent Marketplaces

본 논문은 LLM 기반의 자율 에이전트가 시장에서 상호작용할 때 발생하는 체계적인 경제적 리스크를 해결하고자 한다. 기존의 AI 정렬 방식은 개별 에이전트의 사실성이나 무해성에만 집중할 뿐, 다수의 에이전트가 상호작용하며 만드는 시장 수준의 불안정성을 제어하지 못한다.

#Review #Multi-Agent Systems #Economic Alignment #Large Language Models #Simulation Framework #Market Stability #Reinforcement Learning

2026년 5월 18일

[논문리뷰] Actionable World Representation

본 논문은 물리 세계의 역학을 효과적으로 modeling하고 제어할 수 있는, 신뢰성 있는 디지털 트윈(Digital Twin)을 구축하는 문제를 해결하고자 합니다.

#Review #Physical World Models #Digital Twin #Neural Implicit Representation #Actionable Representation #Deformation Modeling

2026년 5월 18일

[논문리뷰] AI for Auto-Research: Roadmap & User Guide

본 논문은 AI가 연구의 전 과정을 자동화할 수 있는 단계에 이르렀으나, 이로 인해 발생하는 심각한 연구 무결성(Integrity) 문제를 해결하고자 합니다.

#Review #AI-assisted research #Research Lifecycle #Autonomous Agents #Scientific Integrity #End-to-End Analysis #Research Integrity

2026년 5월 18일

[논문리뷰] A2RBench: An Automatic Paradigm for Formally Verifiable Abstract Reasoning Benchmark Generation

현재 Large Language Models (LLM)의 추상적 추론 능력 평가는 진정한 추론 요구와 벤치마크 확장성 사이의 근본적인 trade-off에 직면해 있다.

#Review #Abstract Reasoning #LLM Evaluation #Cycle Consistency #Benchmark Generation #Formal Verification #Task Expansion #Cognitive Analysis

2026년 5월 18일

[논문리뷰] WorldAct: Activating Monolithic 3D Worlds into Interactive-Ready Object-Centric Scenes

본 논문은 최신 3D generative world model들이 생성한 장면의 정적인 특성과 낮은 편집 가능성 문제를 해결하기 위해 WorldAct를 제안합니다.

#Review #3D Gaussian Splatting #Scene Decomposition #Agent-Driven Interaction #3D World Modeling #Embodied Simulation #Interactive Content Creation

2026년 5월 17일

[논문리뷰] Unlocking Dense Metric Depth Estimation in VLMs

본 논문은 기존 VLMs가 2D 과업에는 뛰어나지만 3D 이해 능력은 여전히 제한적이라는 핵심 문제에서 출발합니다 . 기존 연구들은 외부의 3D 전문 모델로부터 지식을 증류하거나, 텍스트 기반으로만 학습하여 정밀한 기하학적 정보가 부족하고 오류가 누적되는 한계를 보입니다.

#Review #Vision-Language Models #Dense Metric Depth Estimation #3D Geometry #Unified Supervision #Spatial Reasoning

2026년 5월 17일

[논문리뷰] Steered LLM Activations are Non-Surjective

본 연구는 Activation Steering이 유도하는 모델의 내부 행동 변화가 실제 텍스트 프롬프트를 통해서도 동일하게 구현 가능한지라는 근본적인 의문을 해결하고자 합니다.

#Review #Activation Steering #Surjectivity #LLM Interpretability #Prompt-Reachability #White-box Intervention #AI Safety

2026년 5월 17일

[논문리뷰] Sparse Autoencoders enable Robust and Interpretable Fine-tuning of CLIP models

본 논문은 CLIP과 같은 대규모 vision-language 모델을 하위 태스크(downstream task)에 맞게 fine-tuning할 때 발생하는 OOD(Out-of-Distribution) 성능 저하 문제를 해결하고자 한다.

#Review #CLIP #Sparse Autoencoders #Robust Fine-tuning #Interpretability #Representational Drift #Computer Vision

2026년 5월 17일

[논문리뷰] Solvita: Enhancing Large Language Models for Competitive Programming via Agentic Evolution

본 논문은 기존 LLM 기반 경쟁 프로그래밍 에이전트들이 가진 상태 비저장(stateless) 구조의 한계를 해결하고자 합니다. 대다수의 최신 프레임워크는 문제 해결 시마다 처음부터 시작하며, 과거의 디버깅 경험이나 실패 기록을 재사용하지 못하는 고립된 구조를 띱니다 .

#Review #Large Language Models #Competitive Programming #Agentic Evolution #Reinforcement Learning #Knowledge Network #Code Generation #Multi-Agent System

2026년 5월 17일

[논문리뷰] ReactiveGWM: Steering NPC in Reactive Game World Models

본 논문은 기존의 Game World Models가 NPC를 단순한 배경 요소로 취급하여 상호작용이 결여된 정적인 비디오 렌더러에 머물러 있는 문제를 해결하고자 합니다.

#Review #Game World Models #NPC #Controllable Video Generation #Diffusion Models #Strategy Transfer #Cross-Attention #Interaction Logic

2026년 5월 17일

[논문리뷰] PhysBrain 1.0 Technical Report

본 논문은 기존 VLA 시스템이 의존하는 플랫폼 종속적인 로봇 궤적(Trajectory) 데이터 수집의 한계를 극복하고, 물리적 환경에 대한 근본적인 이해(Physical Commonsense)를 확보하는 것을 목표로 합니다.

#Review #Vision-Language-Action Models #Embodied Intelligence #Physical Commonsense #Egocentric Video #Data Engine #VLA Adaptation

2026년 5월 17일

[논문리뷰] PAGER: Bridging the Semantic-Execution Gap in Point-Precise Geometric GUI Control

본 연구는 기존 GUI 에이전트들이 주로 의존하는 'region-tolerant' 패러다임이 정밀한 기하학적 구성 작업에서 실패하는 근본적인 문제를 해결하고자 한다.

#Review #GUI Agents #Geometric Reasoning #Precision-Sensitive #Dependency-Structured Planning #Pixel-Grounded Supervised Tuning #Reinforcement Learning #Semantic-Execution Gap

2026년 5월 17일