Review

[논문리뷰] MOCHA: Multi-Objective Chebyshev Annealing for Agent Skill Optimization

본 논문은 LLM agent의 skill 최적화가 근본적으로 다목적(multi-objective) 문제임에도 불구하고, 기존 방식들이 이를 단일 목적 함수로 축소함으로써 발생하는 비효율성을 해결하고자 합니다.

#Review #Multi-Objective Optimization #LLM Agents #Skill Optimization #Chebyshev Scalarization #Hypervolume #Prompt Engineering #Constraint Satisfaction

2026년 5월 20일

[논문리뷰] LongMINT: Evaluating Memory under Multi-Target Interference in Long-Horizon Agent Systems

본 논문은 현재의 memory-augmented agent들이 현실 세계의 복잡하고 진화하는 long-horizon 환경에서 겪는 기억 오류 문제를 해결하고자 한다.

#Review #Long-Horizon #Agent Systems #Memory Evaluation #Multi-Target Interference #Retrieval-Augmented Generation #Benchmarking

2026년 5월 20일

[논문리뷰] Learn-by-Wire Training Control Governance: Bounded Autonomous Training Under Stress for Stability and Efficiency

본 논문은 현대의 Large Language Models 학습이 직면한 불안정성(Instability)과 이로 인한 컴퓨팅 자원 낭비 문제를 시스템 차원의 제어 문제로 정의합니다.

#Review #Large Language Models #Training Control Governance #LBW-Guard #AdamW #Training Stability #Bounded Autonomous Control #Compute Efficiency

2026년 5월 20일

[논문리뷰] LLMEval-Logic: A Solver-Verified Chinese Benchmark for Logical Reasoning of LLMs with Adversarial Hardening

본 논문은 LLM의 자연어 논리 추론 능력을 평가하는 기존 벤치마크들이 겪고 있는 한계를 극복하기 위해 LLMEval-Logic을 제안한다 .

#Review #LLM #Logical Reasoning #Benchmark #Z3 #Adversarial Hardening #NL-to-FL

2026년 5월 20일

[논문리뷰] It Takes Two: Complementary Self-Distillation for Contextual Integrity in LLMs

본 논문은 LLM이 개인 비서(Personal Agent)로 활용되면서 발생하는 문맥적 프라이버시(Contextual Integrity) 문제를 해결하고자 합니다.

#Review #Contextual Integrity #Large Language Models #Self-Distillation #Product-of-Experts #Privacy-Utility Trade-off #Alignment

2026년 5월 20일

[논문리뷰] IndusAgent: Reinforcing Open-Vocabulary Industrial Anomaly Detection with Agentic Tools

본 논문은 MLLM의 강력한 제로샷 성능에도 불구하고, 고도의 정밀함이 요구되는 산업 환경에서 도메인 불일치 및 구조적 환각(structural hallucination)으로 인해 발생하는 이상 탐지 성능 저하 문제를 해결합니다 .

#Review #Industrial Anomaly Detection #Multimodal Large Language Models #Agentic Framework #Reinforcement Learning #Tool Augmentation #Zero-shot Learning

2026년 5월 20일

[논문리뷰] HRM-Text: Efficient Pretraining Beyond Scaling

본 논문은 대규모 컴퓨팅 자원과 인터넷 규모의 raw text에 의존하는 기존의 Large Language Model(LLM) pretraining 패러다임이 가진 극심한 비효율성을 해결하고자 합니다.

#Review #Hierarchical Recurrent Model #Efficient Pretraining #MagicNorm #Task-completion Objective #PrefixLM #Compute Efficiency

2026년 5월 20일

[논문리뷰] Generative Recursive Reasoning

본 논문은 기존 Recursive Reasoning Models(RRMs)가 지닌 결정론적 성격으로 인한 탐색 능력 저하와 다중 해법 문제 해결의 한계를 해결하고자 합니다.

#Review #Recursive Reasoning Models #Generative Latent Modeling #Stochastic Latent Transitions #Inference-Time Scaling #Constraint Satisfaction #Amortized Variational Inference

2026년 5월 20일

[논문리뷰] Evaluating Temporal Semantic Caching and Workflow Optimization in Agentic Plan-Execute Pipelines

본 논문은 산업 자산 운영(Asset Operations) 분야의 에이전트 파이프라인이 겪는 높은 대기 시간과 기존 캐싱 기법의 한계 문제를 해결합니다.

#Review #Agentic Pipeline #Model Context Protocol #Temporal Semantic Caching #Workflow Optimization #Industrial Asset Operations #Latency Reduction

2026년 5월 20일

[논문리뷰] Enhancing Train-Free Infinite-Frame Generation for Consistent Long Videos

본 논문은 Foundation video generation 모델을 활용하여 학습 없이 무한한 길이의 영상을 일관성 있게 생성하는 것을 목표로 합니다.

#Review #Long Video Generation #Train-Free #Autoregressive Generation #Consistency Enhancement #Diffusion Models #Test-Time Scaling #Temporal Consistency

2026년 5월 20일

[논문리뷰] DrawMotion: Generating 3D Human Motions by Freehand Drawing

본 논문은 텍스트 기술만으로는 사용자가 의도한 복잡하고 세밀한 3D 모션을 정밀하게 제어하기 어렵다는 점을 해결하고자 합니다. 기존 연구들은 복잡한 텍스트 묘사에 의존하거나, 추가적인 모델링을 통해 모션을 수정하지만 이는 사용자에게 상당한 시간적 비용과 입력 부담을 초래합니다.

#Review #Diffusion Models #Motion Generation #Human-Computer Interaction #Freehand Drawing #Multi-Condition Fusion #Intermediate Feature Guidance #Neural Collapse

2026년 5월 20일

[논문리뷰] CutVerse: A Compositional GUI Agents Benchmark for Media Post-Production Editing

기존의 GUI 에이전트는 웹 탐색이나 단순 OS 작업에서는 상당한 진전을 보였으나, 정교한 미디어 후반 작업과 같은 전문적인 창의적 워크플로우에 대한 대응 능력은 거의 검증되지 않았습니다.

#Review #GUI Agents #Media Post-Production #Benchmark #Multimodal #Long-Horizon #Grounding #Vibe Cutting

2026년 5월 20일

[논문리뷰] Conditional Equivalence of DPO and RLHF: Implicit Assumption, Failure Modes, and Provable Alignment

본 연구는 DPO와 RLHF 간의 이론적 동치성이 모든 경우에 성립하는 것이 아니라, 특정 가정에 의존하는 조건부 동치성임을 밝힙니다.

#Review #DPO #RLHF #Constrained Preference Optimization #Bradley-Terry Model #Alignment #Soft Margin Ranking #Absolute Advantage

2026년 5월 20일

[논문리뷰] A Survey of Large Audio Language Models: Generalization, Trustworthiness, and Outlook

본 논문은 LALMs 분야의 급격한 발전에도 불구하고, 모델의 성능 평가 기준과 범용적 활용에 대한 통합적인 체계가 부족하다는 점을 해결하고자 한다.

#Review #Large Audio Language Models #Audio-Language Pretraining #Multimodal Foundation Models #Audio Reasoning #Model Alignment #Generalization #Trustworthiness

2026년 5월 20일

[논문리뷰] optimize_anything: A Universal API for Optimizing any Text Parameter

본 논문은 최적화 문제를 텍스트 아키텍처 개선으로 정의하고, 이를 통해 다양한 도메인에서 범용적으로 작동하는 통합 최적화 시스템을 제안한다.

#Review #LLM optimization #text artifact optimization #evolutionary search #agentic systems #Pareto optimization #declarative API

2026년 5월 19일

[논문리뷰] Where Does Authorship Signal Emerge in Encoder-Based Language Models?

죄송합니다. 제공해주신 논문 URL https://arxiv.org/html/2605.19908에 접속하여 내용을 가져오는 데 실패했습니다. 따라서 논문을 분석하고 요약하는 작업을 수행할 수 없습니다.

2026년 5월 19일

[논문리뷰] When Vision Speaks for Sound

본 논문은 최신 Video-LLMs가 오디오 이해 능력을 갖춘 것처럼 보이지만, 실제로는 오디오를 검증하지 않고 시각적 단서에서 사운드를 추론하거나 할루시네이션(Hallucination)을 일으키는 Clever Hans effect에 빠져 있음을 지적합니다 .

#Review #Video-LLMs #Audio-Visual Grounding #Clever Hans Effect #Intervention-Driven Diagnostics #Direct Preference Optimization (DPO)#Multimodal Alignment

2026년 5월 19일

[논문리뷰] Video Models Can Reason with Verifiable Rewards

본 논문은 기존의 비디오 생성 모델이 시각적 사실성(Perceptual Realism)은 뛰어나지만, 특정 논리적 제약을 만족해야 하는 추론 문제 해결에는 한계가 있다는 점을 지적합니다. 기존의 지도 학습(SFT) 방식은 생성된 영상의 외형적 패턴을 모방할 뿐, 영상 내부의 물리적·논리적 올바름을 보장하지 못합니다 .

#Review #Video Generation #Reinforcement Learning #Verifiable Rewards #Video Reasoning #Diffusion Models #Flow-Matching #RLVR

2026년 5월 19일

[논문리뷰] TideGS: Scalable Training of Over One Billion 3D Gaussian Splatting Primitives via Out-of-Core Optimization

본 논문은 billion-scale 3DGS training 시 발생하는 GPU VRAM 한계 문제를 해결하기 위해 TideGS를 제안합니다. 기존의 3DGS는 모델 파라미터가 증가함에 따라 메모리 수요가 선형적으로 증가하여, 24GB GPU 기준 약 1,100만 개의 가우시안으로 규모가 제한됩니다 .

#Review #3D Gaussian Splatting #Out-of-Core Optimization #Scalable Training #Visibility-induced Sparsity #Trajectory-Adaptive Streaming

2026년 5월 19일

[논문리뷰] Semantic Generative Tuning for Unified Multimodal Models

본 논문은 현대 UMM들이 이해와 생성이라는 두 핵심 과업을 분리된 최적화 경로로 학습함으로써 발생하는 표현적 불일치(Representational misalignment) 문제를 해결하고자 합니다.

#Review #Unified Multimodal Models #Generative Tuning #Image Segmentation #Multimodal Alignment #Semantic Proxy #Representation Learning

2026년 5월 19일