최신 포스트

[논문리뷰] Mean Mode Screaming: Mean--Variance Split Residuals for 1000-Layer Diffusion Transformers

초심층 Diffusion Transformers (DiTs)를 수백 층 이상으로 확장할 때 발생하는 구조적 취약점인 '평균 지향적 붕괴(mean-dominated collapse)' 현상을 해결하는 것이 본 연구의 목적입니다.

#Review #Diffusion Transformers #Residual Stability #Mean Mode Screaming #MV-Split Residuals #Deep Scaling #Gradient Decomposition

2026년 5월 10일

[논문리뷰] MatryoshkaLoRA: Learning Accurate Hierarchical Low-Rank Representations for LLM Fine-Tuning

본 논문은 기존 LoRA 방식이 고정된 rank $R$에 의존하여 최적의 성능을 찾기 위해 반복적인 grid search가 필요하다는 점을 해결하고자 합니다.

#Review #LoRA #Parameter-Efficient Fine-Tuning #Rank-Adaptive #Matryoshka Representation Learning #LLM #Hierarchical Low-Rank

2026년 5월 10일

[논문리뷰] MISA: Mixture of Indexer Sparse Attention for Long-Context LLM Inference

본 논문은 Long-context LLM Inference에서 indexer 연산이 전체 비용의 지배적인 비중을 차지하는 문제를 해결하기 위해 MISA를 제안한다.

#Review #Large Language Models #Long-Context #Sparse Attention #Mixture of Experts #Indexer #Inference Efficiency #Retrieval

2026년 5월 10일

[논문리뷰] MDN: Parallelizing Stepwise Momentum for Delta Linear Attention

본 논문은 기존 Linear Attention 모델들이 가지는 재귀적 업데이트의 한계인 정보 소실과 최적화 효율 저하 문제를 해결하고자 한다. 특히, 기존 모델들은 naive SGD 업데이트에 의존하여 장기 기억 및 문맥 검색(in-context retrieval) 능력에 제약이 있다.

#Review #Linear Attention #Delta Rule #Stepwise Momentum #Chunkwise Parallelism #Second-order Dynamical Systems #Gated Linear Architecture

2026년 5월 10일

[논문리뷰] MACE-Dance: Motion-Appearance Cascaded Experts for Music-Driven Dance Video Generation

본 논문은 음악 기반 댄스 비디오 생성 시 발생하는 모션의 비현실성과 시각적 일관성 부족 문제를 해결하는 것을 목표로 합니다. 기존 연구들은 주로 3D 모션 생성에만 집중하거나, 인물 이미지 애니메이션 기술을 그대로 적용하여 복잡한 댄스 동작을 제대로 처리하지 못하는 한계가 있습니다.

#Review #Music-Driven Dance #Video Generation #Mixture-of-Experts #Diffusion Model #BiMamba-Transformer #Guidance-Free Training

2026년 5월 10일

[논문리뷰] Listwise Policy Optimization: Group-based RLVR as Target-Projection on the LLM Response Simplex

본 논문은 현재의 Critic-free, group-based RLVR 기법들이 사용하는 advantage normalization이 실제로는 응답 심플렉스 위에서 잠재적인 목표 분포를 암묵적으로 구성하고 있음을 규명합니다.

#Review #RLVR #Policy Optimization #Listwise #Target-Projection #Large Language Models #Reasoning #Gibbs Target

2026년 5월 10일

[논문리뷰] LiVeAction: a Lightweight, Versatile, and Asymmetric Neural Codec Design for Real-time Operation

본 논문은 현대의 고해상도 데이터 생성 센서 환경에서 발생하는 대역폭 및 전력 제약을 해결하기 위한 효율적인 신경망 코덱의 필요성을 다룬다. 기존의 상용 코덱(JPEG, MPEG)은 인간 지각에 최적화되어 있어 머신 퍼셉션 작업이나 비전통적 모달리티(공간 오디오, 하이퍼스펙트럴 등)에는 부적합하다.

#Review #Neural Compression #Real-time #Asymmetric Autoencoder #Finite Scalar Quantization #Rate-Distortion

2026년 5월 10일

[논문리뷰] LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling

본 논문은 기존의 TTS 전략이 연구자들의 직관에 의존하는 수작업(Hand-crafted) 방식이라는 한계점을 해결하고자 합니다.

#Review #Test-Time Scaling #Agentic Discovery #Controller Synthesis #Replay Environment #AutoTTS #Adaptive Inference #Accuracy-Cost Tradeoff

2026년 5월 10일

[논문리뷰] InterLV-Search: Benchmarking Interleaved Multimodal Agentic Search

본 논문은 기존의 멀티모달 에이전트 벤치마크들이 시각적 증거를 단순히 답변의 최종 종착지(Endpoint)로만 취급하여, 실제 정보 탐색 과정에서 시각적 정보가 검색 경로를 제어하는 역할을 간과한다는 문제를 지적합니다.

#Review #Multimodal Agent #Interleaved Search #Visual Evidence #Agentic Search Benchmark #Multimodal Reasoning #Open-web Search

2026년 5월 10일

[논문리뷰] IntentGrasp: A Comprehensive Benchmark for Intent Understanding

본 논문은 현재 LLM 생태계에서 사용자 의도를 정확히 파악하는 능력이 체계적으로 평가되지 않고 있다는 문제 의식에서 출발합니다.

#Review #Intent Understanding #LLM Benchmarking #IntentGrasp #Intentional Fine-Tuning #Intent Classification #Cross-domain Generalizability

2026년 5월 10일

[논문리뷰] HyperEyes: Dual-Grained Efficiency-Aware Reinforcement Learning for Parallel Multimodal Search Agents

본 논문은 기존 Multimodal search agents가 다중 엔티티 검색 시 직면하는 비효율적인 순차적(sequential) 툴 호출 문제를 해결하기 위해 제안되었다.

#Review #Multimodal Search Agents #Reinforcement Learning #Efficiency-Aware #Unified Grounded Search #Parallel Tool Calling #IMEB Benchmark #On-Policy Distillation

2026년 5월 10일

[논문리뷰] Gated QKAN-FWP: Scalable Quantum-inspired Sequence Learning

본 논문은 기존 QFWP(Quantum Fast Weight Programmers)가 사용하는 다중 큐비트 회로가 NISQ(Noisy Intermediate-Scale Quantum) 장치에서 확장하기 어렵고, 고전적 시뮬레이션 비용이 크다는 문제를 해결하고자 한다.

#Review #Fast Weight Programming #Quantum Machine Learning #Kolmogorov-Arnold Networks #Sequence Modeling #Reinforcement Learning

2026년 5월 10일

[논문리뷰] From Storage to Experience: A Survey on the Evolution of LLM Agent Memory Mechanisms

본 논문은 LLM 기반 에이전트 메모리 메커니즘의 파편화된 연구 현황을 통합하고, 기술적 진화 경로를 명확히 정립하기 위해 수행되었다. 기존 연구들은 공학적 시스템 엔지니어링 접근과 인지 과학적 모방 접근 사이에서 분리되어 발전해 왔으며, 이로 인해 메모리 기술의 핵심적인 진화 논리가 체계적으로 정리되지 못했다 .

#Review #LLM Agent #Memory Mechanism #Storage #Reflection #Experience #Continual Learning

2026년 5월 10일

[논문리뷰] Flow-OPD: On-Policy Distillation for Flow Matching Models

본 논문은 Flow Matching 모델의 다중 작업 정렬(multi-task alignment) 과정에서 발생하는 보상 희소성(reward sparsity)과 기울기 간섭(gradient interference) 문제를 해결하고자 합니다.

#Review #Flow Matching #On-Policy Distillation #Reinforcement Learning #Multi-task Alignment #Manifold Anchor Regularization #Text-to-Image

2026년 5월 10일

[논문리뷰] Fast Byte Latent Transformer

본 논문은 byte-level language model이 지닌 고질적인 추론 속도 문제를 해결하는 것을 목적으로 한다. 기존의 바이트 단위 모델은 Subword 모델과 달리 입력 길이가 훨씬 길어지기 때문에, Naive한 자기회귀(Autoregressive) 방식으로는 매우 느린 추론 속도를 보인다는 한계가 있다.

#Review #Byte-level Language Model #BLT #Diffusion #Inference Acceleration #Speculative Decoding #Latent Tokenization

2026년 5월 10일

[논문리뷰] Empirical Evidence for Simply Connected Decision Regions in Image Classifiers

본 논문은 현대의 deep neural network가 학습한 결정 영역이 단순히 path connected할 뿐만 아니라, 더 강력한 위상적 성질인 simply connected를 만족하는지 규명하고자 한다.

#Review #Deep Neural Networks #Decision Regions #Topology #Simply Connected #Coons Patches #Adversarial Robustness

2026년 5월 10일

[논문리뷰] DecodingTrust-Agent Platform (DTap): A Controllable and Interactive Red-Teaming Platform for AI Agents

본 논문은 복잡한 워크플로우를 자동화하는 AI 에이전트의 보안 위협을 체계적으로 평가할 수 있는 표준화된 플랫폼과 벤치마크의 부재 문제를 해결합니다.

#Review #AI Agents #Red-Teaming #Safety Evaluation #Agentic Systems #Security Risk Assessment

2026년 5월 10일

[논문리뷰] CPCANet: Deep Unfolding Common Principal Component Analysis for Domain Generalization

본 논문은 기존의 DG 방법들이 데이터 간의 통계적 거리를 정렬하거나 대규모 모델의 표현력에 의존하는 방식에서 벗어나, 도메인 간의 불변 구조를 직접적으로 추출하지 못한다는 한계를 해결하고자 합니다.

#Review #Domain Generalization #Common Principal Component Analysis #Deep Unfolding Networks #Riemannian Optimization #Stiefel Manifold

2026년 5월 10일

[논문리뷰] CASCADE: Case-Based Continual Adaptation for Large Language Models During Deployment

현재의 LLM 라이프사이클은 대규모 pretraining과 finetuning이라는 두 단계에 고정되어 있어, 일단 배포되면 학습이 완전히 중단되는 한계가 있습니다.

#Review #Large Language Models #Deployment-Time Learning #Case-Based Reasoning #Contextual Bandit #No-Regret Learning #Experiential Learning

2026년 5월 10일

[논문리뷰] Beyond Retrieval: A Multitask Benchmark and Model for Code Search

코드 검색 벤치마크 분야는 데이터 오염, 평가 지표의 단일성, 그리고 실제 배포 환경과 괴리된 평가 방식으로 인해 정교한 모델 성능 측정이 어렵습니다.

#Review #Code Search #Benchmark #Reranker #Data Contamination #Retrieval-Augmented Generation #Code LLM

2026년 5월 10일