최신 포스트

[논문리뷰] Personalization as Inverse Planning: Learning Latent Design Intents for Agentic Slide Generation via Structural Denoising

본 논문은 기존의 AI 에이전트 기반 슬라이드 생성 시스템이 가진 Page-level 디자인의 한계를 해결하고자 합니다. 기존 방식들은 사전에 정의된 템플릿에 의존하거나, 사용자의 장황한 직접 지시(verbose instructions)에만 의존하여 개인화된 디자인 의도를 파악하는 데 실패합니다.

#Review #Page-level Slide Personalization #Inverse Planning #Structural Denoising #Reinforcement Learning #Latent Design Intent #Multi-agent Framework #Agentic Workflow

2026년 7월 1일

[논문리뷰] PerceptionRubrics: Calibrating Multimodal Evaluation to Human Perception

본 논문은 기존의 MLLM 벤치마크가 포화 상태에 이르렀음에도 불구하고, 실제 환경에서의 모델 성능은 여전히 취약하다는 '평가 역설(Evaluation Paradox)'을 해결하고자 합니다 .

#Review #Multimodal Large Language Models #Perception Evaluation #Rubric-Based Auditing #Gated Scoring #Visual Grounding #Human Alignment

2026년 7월 1일

[논문리뷰] Perceive-to-Reason: Decoupling Perception and Reasoning for Fine-Grained Visual Reasoning

본 논문은 VLM이 고해상도 이미지 내의 미세한 시각적 단서를 인식하고 추론하는 능력이 부족하다는 문제에 주목합니다 .

#Review #Fine-Grained Visual Reasoning #VLM #Perceiver #Reasoner #Reinforcement Learning #PRA-GRPO #Decoupling

2026년 7월 1일

[논문리뷰] NoPA: Non-Parametric Online 3D Scene Graph Generation

본 논문은 실시간 3D SSG 생성 시 발생하는 계산 효율성과 기하학적 정보 손실 간의 트레이드오프 문제를 해결하고자 합니다.

#Review #3D Scene Graph Generation #Online #Non-Parametric #Maximum Mean Discrepancy #Particle Set #Real-time #RGB-D

2026년 7월 1일

[논문리뷰] Multimodal Continuous Reasoning via Asymmetric Mutual Variational Learning

본 논문은 MLLM의 추론 능력이 discrete language-space bottleneck에 의해 제한되는 문제를 해결하고자 한다.

#Review #Multimodal Large Language Models #Latent Reasoning #Variational Inference #Asymmetric Mutual Learning #Train-Inference Mismatch #Answer Leakage

2026년 7월 1일

[논문리뷰] MemSyco-Bench: Benchmarking Sycophancy in Agent Memory

본 논문은 에이전트 시스템에서 장기 기억이 오히려 에이전트의 판단력을 흐리는 Memory-induced Sycophancy 문제를 해결하고자 합니다. 기존의 기억 관련 벤치마크들은 주로 기억의 Retrieval 성공 여부만을 측정할 뿐, 검색된 기억이 이후의 추론 및 의사결정 과정에 미치는 부작용을 간과하고 있습니다.

#Review #LLM-based Agents #Long-term Memory #Sycophancy #Benchmark #Memory-induced Sycophancy #Post-retrieval Reasoning

2026년 7월 1일

[논문리뷰] Graph-Native Reinforcement Learning Enables Traceable Scientific Hypothesis Generation through Conceptual Recombination

본 연구는 기존 LLM이 과학적 가설 생성 시 fluent한 텍스트를 생성하더라도 intermediate reasoning의 추적 가능성(traceability)이 낮고 인과적 관계가 불분명하다는 한계를 해결하고자 한다 .

#Review #Graph-native reasoning #Scientific hypothesis generation #Reinforcement learning #Materials design #Large language models #GRPO

2026년 7월 1일

[논문리뷰] ELDR: Expert-Locality-Aware Decode Routing for PD-Disaggregated MoE Serving

본 논문은 PD-disaggregated MoE 서빙 환경에서 기존 라우팅 방식이 단순히 부하 분산(Load balancing)에만 집중하여 발생하는 비효율을 해결하고자 합니다.

#Review #Mixture-of-Experts #PD-Disaggregated Serving #Expert Locality #Decode Routing #Prefix Caching #TPOT

2026년 7월 1일

[논문리뷰] Domain Arithmetic: One-Shot VLA Adaptation under Environmental Shifts

본 논문은 VLA 모델이 학습되지 않은 새로운 환경(예: 카메라 시점 변화, 로봇 기구학적 차이)에서 성능이 저하되는 문제를 해결하고자 합니다. 기존 방식은 새로운 환경에 적응하기 위해 대량의 시연 데이터로 모든 태스크를 Fine-tuning해야 하므로, 데이터 수집 비용이 매우 크고 실용적이지 않습니다.

#Review #Vision-Language-Action Models #One-Shot Adaptation #Domain Arithmetic #Weight Arithmetic #Subspace Alignment #Environmental Shifts

2026년 7월 1일

[논문리뷰] Cross-Domain Generalization Failure in Lightweight Intrusion Detection Models for IIoT Networks

본 논문은 경량 IIoT IDS 모델들이 학습 데이터셋 내에서는 우수한 성능을 보이지만, 실제 배포 시 네트워크가 변경되면 성능이 급격히 저하되는 Cross-Domain Generalization 문제에 주목한다.

#Review #Intrusion Detection #IIoT #Cross-Domain Generalization #Lightweight Models #Feature Reliance #Adversarial Robustness #Few-Shot Adaptation

2026년 7월 1일

[논문리뷰] CausalMix: Data Mixture as Causal Inference for Language Model Training

본 논문은 LLM pretraining 시 데이터 배합(Data Mixture)의 불확실성이 모델의 일반화 성능을 저해하는 비효율적인 탐색 문제를 해결하고자 한다.

#Review #Data Mixture #Causal Inference #Language Model Training #Data Selection #Causal Structural Model

2026년 7월 1일

[논문리뷰] BioInsight: Multi-Agent Orchestration for Interactive Biomedical Knowledge Discovery

본 논문은 생의학 분야에서 AI가 생성하는 분석 리포트가 여전히 정적인 텍스트나 표에 머물러 있어, 연구자가 근거를 검증하거나 불확실성을 확인하고 가설을 수정하는 데 한계가 있다는 문제를 제기합니다 .

#Review #Multi-Agent System #Biomedical Knowledge Discovery #Evidence-Centered Interface #Provenance-Preserving #Protein-Function Reasoning #Agentic Workflow

2026년 7월 1일

[논문리뷰] Autonomous Scientific Discovery via Iterative Meta-Reflection

본 논문은 기존의 자율 과학적 발견 시스템들이 가진 고립된 가설 생성 방식과 수동적인 목표 설정 의존성 문제를 해결하고자 한다. 기존 연구들은 대개 단일 데이터에 대해 개별적인 가설을 생성할 뿐, 과거의 발견을 통합적으로 종합하여 구조적인 미지 현상을 추론하는 능력이 부족하다 .

#Review #Autonomous Scientific Discovery #Iterative Meta-Reflection #Large Language Models #Multimodal Data Analysis #Statistical Validation #Open-ended Research

2026년 7월 1일

[논문리뷰] AutoTrainess: Teaching Language Models to Improve Language Models Autonomously

본 논문은 최신 LLM이 복잡한 소프트웨어 엔지니어링 작업에 능숙함에도 불구하고, 정작 모델 자체의 성능을 개선하는 과정은 여전히 인간의 높은 노동력과 전문 지식에 의존하고 있다는 점을 해결하고자 합니다.

#Review #Autonomous Post-Training #LM Agent #Agent-Computer Interface (ACI)#PostTrainBench #LLM Self-Improvement #Software Engineering

2026년 7월 1일

[논문리뷰] AtomiMed: Hierarchical Atomic Fact-Checking for Universal Clinical-Aware Medical Report Evaluation

본 논문은 기존의 Medical Report Generation(MRG) 평가 지표들이 임상적 사실성(Clinical factual accuracy)을 제대로 측정하지 못하고, 특히 치명적인 진단 오류를 간과한다는 근본적인 한계를 해결하고자 한다.

#Review #Medical Report Generation #Fact-Checking #Clinical-Awareness #Atomic Clinical Facts #Multi-modal Benchmark #Agentic Cross-Verification

2026년 7월 1일

[논문리뷰] ASPIRE: Agentic /Skills Discovery for Robotics

본 논문은 기존 로봇 제어 방식이 환경 변화나 실패 상황에서 경험을 누적하지 못하고 매번 초기화되는 문제를 해결하고자 합니다. 기존 연구(Baseline)는 태스크 단위의 coarse한 피드백에만 의존하여 실패 원인을 정확히 진단하기 어렵고, 발견된 해결책을 재사용할 수 없는 폐쇄적인 구조를 가집니다.

#Review #Robotics #Code-as-Policy #Continual Learning #Skill Library #Evolutionary Search #Embodied AI

2026년 7월 1일

[논문리뷰] AI translation of literary texts is 'fine', but readers still prefer human translations

본 논문은 현대의 LLM 기반 번역이 문학적 텍스트를 처리할 수 있게 되었음에도 불구하고, 실제 독자의 몰입감과 문학적 경험 측면에서 인간 번역가와 어떤 차이를 보이는지에 대한 불확실성을 해결하고자 한다.

#Review #Literary Translation #Machine Translation #Human-AI Interaction #Large Language Models #Reader-centered Evaluation #Immersive Reading #Close Reading #LAIT Dataset

2026년 7월 1일

[논문리뷰] ABot-M0.5: Unified Mobility-and-Manipulation World Action Model

본 논문은 모바일 매니퓰레이션(mobile manipulation) 환경에서 기존의 Embodied Learning 방식들이 겪는 구조적 한계를 해결하고자 합니다.

#Review #Mobile Manipulation #World Action Model #Conditional Flow Matching #Latent Actions #Mixture-of-Transformers #Dream Forcing

2026년 7월 1일

[ray] Ray Object Manager의 Pull RPC 배치 처리 최적화 분석

Ray의 PullManager에서 개별 객체 요청을 배치 RPC로 통합하여 네트워크 오버헤드와 CPU 사용량을 획기적으로 개선한 사례를 분석합니다.

#Ray #Distributed Systems #RPC #Optimization #C++

2026년 7월 1일

[sglang] SGLang HiCache에 AMD UMBP 기반 L3 스토리지 백엔드 도입

AMD MI3xx 환경에서 HBM 부족 문제를 해결하기 위해 UMBP 기반의 계층형 DRAM/SSD 스토리지 백엔드를 HiCache에 통합하여 TTFT를 3.5배 개선했습니다.

#SGLang #HiCache #AMD #UMBP #KV-Cache #LLM-Serving

2026년 7월 1일