Review

[논문리뷰] Scaling Continual Learning to 300+ Tasks with Bi-Level Routing Mixture-of-Experts

본 논문은 기존의 CL 방법론들이 20개 내외의 제한된 태스크 수에서만 검증되어 왔다는 한계를 지적하며, 매우 긴 태스크 시퀀스에서 발생하는 성능 저하 문제를 해결하고자 합니다.

#Review #Continual Learning #Class-Incremental Learning #Mixture-of-Experts #Bi-Level Routing #Long Task Sequence

2026년 5월 10일

[논문리뷰] STARFlow2: Bridging Language Models and Normalizing Flows for Unified Multimodal Generation

본 논문은 기존의 통합 멀티모달 모델들이 겪는 생성 메커니즘의 구조적 파편화 문제를 해결하고자 합니다.

#Review #Multimodal Generation #Normalizing Flows #Autoregressive Transformers #Pretzel Architecture #Unified Modeling #Visual Understanding

2026년 5월 10일

[논문리뷰] SCOPE: Structured Decomposition and Conditional Skill Orchestration for Complex Image Generation

본 논문은 복잡한 visual intent를 충족해야 하는 최신 text-to-image 생성 모델들이 겪는 semantic commitment의 단절 문제, 즉 Conceptual Rift를 해결하고자 합니다.

#Review #Text-to-Image Generation #Agentic Framework #Semantic Commitments #Structured Specification #Skill Orchestration #Gen-Arena

2026년 5월 10일

[논문리뷰] Rethinking State Tracking in Recurrent Models Through Error Control Dynamics

본 논문은 recurrent 아키텍처의 상태 추적(state tracking) 능력이 단순히 이론적 표현력(expressivity)만으로 결정되지 않으며, hidden-state의 drift를 제어하는 에러 제어(error control) 역학에 의해 좌우된다는 점을 규명합니다.

#Review #State Tracking #Recurrent Models #Error Control #Affine Recurrences #State-Space Models #Symbolic Dynamics

2026년 5월 10일

[논문리뷰] Rethinking RL for LLM Reasoning: It's Sparse Policy Selection, Not Capability Learning

본 논문은 LLM 추론 능력 향상에 필수적이라고 여겨지는 RL이 실제로 새로운 전략을 학습하는 것이 아니라, 베이스 모델 내에 이미 존재하는 솔루션들의 확률 분포를 재조정하는 것임을 밝힙니다. 기존의 RLVR은 전체 토큰에 대해 비효율적으로 경사 하강법을 수행하지만, 실제 추론 성능 개선은 극히 일부 지점에서 발생합니다.

#Review #Large Language Models #Reinforcement Learning #Reasoning #Decision Points #Sparse Policy Selection #Contrastive Fine-Tuning #Entropy-Gated

2026년 5월 10일

[논문리뷰] R^3-SQL: Ranking Reward and Resampling for Text-to-SQL

본 연구는 기존 Text-to-SQL 시스템의 순위 결정(Ranking) 과정에서 발생하는 Functional Inconsistency와 Bounded Recall이라는 두 가지 핵심 과제를 해결하는 데 목적을 둡니다.

#Review #Text-to-SQL #Ranking #Resampling #Functional Inconsistency #Bounded Recall #Agentic Workflow

2026년 5월 10일

[논문리뷰] Normalizing Trajectory Models

본 논문은 기존 diffusion 및 flow matching 모델이 few-step generation 과정에서 겪는 가우시안(Gaussian) 근사의 한계를 해결하고자 합니다.

#Review #Normalizing Trajectory Models #Flow Matching #Normalizing Flows #Few-step Generation #Exact Likelihood #Stochastic Trajectory

2026년 5월 10일

[논문리뷰] Mean Mode Screaming: Mean--Variance Split Residuals for 1000-Layer Diffusion Transformers

초심층 Diffusion Transformers (DiTs)를 수백 층 이상으로 확장할 때 발생하는 구조적 취약점인 '평균 지향적 붕괴(mean-dominated collapse)' 현상을 해결하는 것이 본 연구의 목적입니다.

#Review #Diffusion Transformers #Residual Stability #Mean Mode Screaming #MV-Split Residuals #Deep Scaling #Gradient Decomposition

2026년 5월 10일

[논문리뷰] MatryoshkaLoRA: Learning Accurate Hierarchical Low-Rank Representations for LLM Fine-Tuning

본 논문은 기존 LoRA 방식이 고정된 rank $R$에 의존하여 최적의 성능을 찾기 위해 반복적인 grid search가 필요하다는 점을 해결하고자 합니다.

#Review #LoRA #Parameter-Efficient Fine-Tuning #Rank-Adaptive #Matryoshka Representation Learning #LLM #Hierarchical Low-Rank

2026년 5월 10일

[논문리뷰] MISA: Mixture of Indexer Sparse Attention for Long-Context LLM Inference

본 논문은 Long-context LLM Inference에서 indexer 연산이 전체 비용의 지배적인 비중을 차지하는 문제를 해결하기 위해 MISA를 제안한다.

#Review #Large Language Models #Long-Context #Sparse Attention #Mixture of Experts #Indexer #Inference Efficiency #Retrieval

2026년 5월 10일

[논문리뷰] MDN: Parallelizing Stepwise Momentum for Delta Linear Attention

본 논문은 기존 Linear Attention 모델들이 가지는 재귀적 업데이트의 한계인 정보 소실과 최적화 효율 저하 문제를 해결하고자 한다. 특히, 기존 모델들은 naive SGD 업데이트에 의존하여 장기 기억 및 문맥 검색(in-context retrieval) 능력에 제약이 있다.

#Review #Linear Attention #Delta Rule #Stepwise Momentum #Chunkwise Parallelism #Second-order Dynamical Systems #Gated Linear Architecture

2026년 5월 10일

[논문리뷰] MACE-Dance: Motion-Appearance Cascaded Experts for Music-Driven Dance Video Generation

본 논문은 음악 기반 댄스 비디오 생성 시 발생하는 모션의 비현실성과 시각적 일관성 부족 문제를 해결하는 것을 목표로 합니다. 기존 연구들은 주로 3D 모션 생성에만 집중하거나, 인물 이미지 애니메이션 기술을 그대로 적용하여 복잡한 댄스 동작을 제대로 처리하지 못하는 한계가 있습니다.

#Review #Music-Driven Dance #Video Generation #Mixture-of-Experts #Diffusion Model #BiMamba-Transformer #Guidance-Free Training

2026년 5월 10일

[논문리뷰] Listwise Policy Optimization: Group-based RLVR as Target-Projection on the LLM Response Simplex

본 논문은 현재의 Critic-free, group-based RLVR 기법들이 사용하는 advantage normalization이 실제로는 응답 심플렉스 위에서 잠재적인 목표 분포를 암묵적으로 구성하고 있음을 규명합니다.

#Review #RLVR #Policy Optimization #Listwise #Target-Projection #Large Language Models #Reasoning #Gibbs Target

2026년 5월 10일

[논문리뷰] LiVeAction: a Lightweight, Versatile, and Asymmetric Neural Codec Design for Real-time Operation

본 논문은 현대의 고해상도 데이터 생성 센서 환경에서 발생하는 대역폭 및 전력 제약을 해결하기 위한 효율적인 신경망 코덱의 필요성을 다룬다. 기존의 상용 코덱(JPEG, MPEG)은 인간 지각에 최적화되어 있어 머신 퍼셉션 작업이나 비전통적 모달리티(공간 오디오, 하이퍼스펙트럴 등)에는 부적합하다.

#Review #Neural Compression #Real-time #Asymmetric Autoencoder #Finite Scalar Quantization #Rate-Distortion

2026년 5월 10일

[논문리뷰] LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling

본 논문은 기존의 TTS 전략이 연구자들의 직관에 의존하는 수작업(Hand-crafted) 방식이라는 한계점을 해결하고자 합니다.

#Review #Test-Time Scaling #Agentic Discovery #Controller Synthesis #Replay Environment #AutoTTS #Adaptive Inference #Accuracy-Cost Tradeoff

2026년 5월 10일

[논문리뷰] InterLV-Search: Benchmarking Interleaved Multimodal Agentic Search

본 논문은 기존의 멀티모달 에이전트 벤치마크들이 시각적 증거를 단순히 답변의 최종 종착지(Endpoint)로만 취급하여, 실제 정보 탐색 과정에서 시각적 정보가 검색 경로를 제어하는 역할을 간과한다는 문제를 지적합니다.

#Review #Multimodal Agent #Interleaved Search #Visual Evidence #Agentic Search Benchmark #Multimodal Reasoning #Open-web Search

2026년 5월 10일

[논문리뷰] IntentGrasp: A Comprehensive Benchmark for Intent Understanding

본 논문은 현재 LLM 생태계에서 사용자 의도를 정확히 파악하는 능력이 체계적으로 평가되지 않고 있다는 문제 의식에서 출발합니다.

#Review #Intent Understanding #LLM Benchmarking #IntentGrasp #Intentional Fine-Tuning #Intent Classification #Cross-domain Generalizability

2026년 5월 10일

[논문리뷰] HyperEyes: Dual-Grained Efficiency-Aware Reinforcement Learning for Parallel Multimodal Search Agents

본 논문은 기존 Multimodal search agents가 다중 엔티티 검색 시 직면하는 비효율적인 순차적(sequential) 툴 호출 문제를 해결하기 위해 제안되었다.

#Review #Multimodal Search Agents #Reinforcement Learning #Efficiency-Aware #Unified Grounded Search #Parallel Tool Calling #IMEB Benchmark #On-Policy Distillation

2026년 5월 10일

[논문리뷰] Gated QKAN-FWP: Scalable Quantum-inspired Sequence Learning

본 논문은 기존 QFWP(Quantum Fast Weight Programmers)가 사용하는 다중 큐비트 회로가 NISQ(Noisy Intermediate-Scale Quantum) 장치에서 확장하기 어렵고, 고전적 시뮬레이션 비용이 크다는 문제를 해결하고자 한다.

#Review #Fast Weight Programming #Quantum Machine Learning #Kolmogorov-Arnold Networks #Sequence Modeling #Reinforcement Learning

2026년 5월 10일

[논문리뷰] From Storage to Experience: A Survey on the Evolution of LLM Agent Memory Mechanisms

본 논문은 LLM 기반 에이전트 메모리 메커니즘의 파편화된 연구 현황을 통합하고, 기술적 진화 경로를 명확히 정립하기 위해 수행되었다. 기존 연구들은 공학적 시스템 엔지니어링 접근과 인지 과학적 모방 접근 사이에서 분리되어 발전해 왔으며, 이로 인해 메모리 기술의 핵심적인 진화 논리가 체계적으로 정리되지 못했다 .

#Review #LLM Agent #Memory Mechanism #Storage #Reflection #Experience #Continual Learning

2026년 5월 10일