[논문리뷰] MDN: Parallelizing Stepwise Momentum for Delta Linear Attention본 논문은 기존 Linear Attention 모델들이 가지는 재귀적 업데이트의 한계인 정보 소실과 최적화 효율 저하 문제를 해결하고자 한다. 특히, 기존 모델들은 naive SGD 업데이트에 의존하여 장기 기억 및 문맥 검색(in-context retrieval) 능력에 제약이 있다.#Review#Linear Attention#Delta Rule#Stepwise Momentum#Chunkwise Parallelism#Second-order Dynamical Systems#Gated Linear Architecture2026년 5월 10일댓글 수 로딩 중
[논문리뷰] MACE-Dance: Motion-Appearance Cascaded Experts for Music-Driven Dance Video Generation본 논문은 음악 기반 댄스 비디오 생성 시 발생하는 모션의 비현실성과 시각적 일관성 부족 문제를 해결하는 것을 목표로 합니다. 기존 연구들은 주로 3D 모션 생성에만 집중하거나, 인물 이미지 애니메이션 기술을 그대로 적용하여 복잡한 댄스 동작을 제대로 처리하지 못하는 한계가 있습니다.#Review#Music-Driven Dance#Video Generation#Mixture-of-Experts#Diffusion Model#BiMamba-Transformer#Guidance-Free Training2026년 5월 10일댓글 수 로딩 중
[논문리뷰] Listwise Policy Optimization: Group-based RLVR as Target-Projection on the LLM Response Simplex본 논문은 현재의 Critic-free, group-based RLVR 기법들이 사용하는 advantage normalization이 실제로는 응답 심플렉스 위에서 잠재적인 목표 분포를 암묵적으로 구성하고 있음을 규명합니다.#Review#RLVR#Policy Optimization#Listwise#Target-Projection#Large Language Models#Reasoning#Gibbs Target2026년 5월 10일댓글 수 로딩 중
[논문리뷰] LiVeAction: a Lightweight, Versatile, and Asymmetric Neural Codec Design for Real-time Operation본 논문은 현대의 고해상도 데이터 생성 센서 환경에서 발생하는 대역폭 및 전력 제약을 해결하기 위한 효율적인 신경망 코덱의 필요성을 다룬다. 기존의 상용 코덱(JPEG, MPEG)은 인간 지각에 최적화되어 있어 머신 퍼셉션 작업이나 비전통적 모달리티(공간 오디오, 하이퍼스펙트럴 등)에는 부적합하다.#Review#Neural Compression#Real-time#Asymmetric Autoencoder#Finite Scalar Quantization#Rate-Distortion2026년 5월 10일댓글 수 로딩 중
[논문리뷰] LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling본 논문은 기존의 TTS 전략이 연구자들의 직관에 의존하는 수작업(Hand-crafted) 방식이라는 한계점을 해결하고자 합니다.#Review#Test-Time Scaling#Agentic Discovery#Controller Synthesis#Replay Environment#AutoTTS#Adaptive Inference#Accuracy-Cost Tradeoff2026년 5월 10일댓글 수 로딩 중
[논문리뷰] InterLV-Search: Benchmarking Interleaved Multimodal Agentic Search본 논문은 기존의 멀티모달 에이전트 벤치마크들이 시각적 증거를 단순히 답변의 최종 종착지(Endpoint)로만 취급하여, 실제 정보 탐색 과정에서 시각적 정보가 검색 경로를 제어하는 역할을 간과한다는 문제를 지적합니다.#Review#Multimodal Agent#Interleaved Search#Visual Evidence#Agentic Search Benchmark#Multimodal Reasoning#Open-web Search2026년 5월 10일댓글 수 로딩 중
[논문리뷰] IntentGrasp: A Comprehensive Benchmark for Intent Understanding본 논문은 현재 LLM 생태계에서 사용자 의도를 정확히 파악하는 능력이 체계적으로 평가되지 않고 있다는 문제 의식에서 출발합니다.#Review#Intent Understanding#LLM Benchmarking#IntentGrasp#Intentional Fine-Tuning#Intent Classification#Cross-domain Generalizability2026년 5월 10일댓글 수 로딩 중
[논문리뷰] HyperEyes: Dual-Grained Efficiency-Aware Reinforcement Learning for Parallel Multimodal Search Agents본 논문은 기존 Multimodal search agents가 다중 엔티티 검색 시 직면하는 비효율적인 순차적(sequential) 툴 호출 문제를 해결하기 위해 제안되었다.#Review#Multimodal Search Agents#Reinforcement Learning#Efficiency-Aware#Unified Grounded Search#Parallel Tool Calling#IMEB Benchmark#On-Policy Distillation2026년 5월 10일댓글 수 로딩 중
[논문리뷰] Gated QKAN-FWP: Scalable Quantum-inspired Sequence Learning본 논문은 기존 QFWP(Quantum Fast Weight Programmers)가 사용하는 다중 큐비트 회로가 NISQ(Noisy Intermediate-Scale Quantum) 장치에서 확장하기 어렵고, 고전적 시뮬레이션 비용이 크다는 문제를 해결하고자 한다.#Review#Fast Weight Programming#Quantum Machine Learning#Kolmogorov-Arnold Networks#Sequence Modeling#Reinforcement Learning2026년 5월 10일댓글 수 로딩 중
[논문리뷰] From Storage to Experience: A Survey on the Evolution of LLM Agent Memory Mechanisms본 논문은 LLM 기반 에이전트 메모리 메커니즘의 파편화된 연구 현황을 통합하고, 기술적 진화 경로를 명확히 정립하기 위해 수행되었다. 기존 연구들은 공학적 시스템 엔지니어링 접근과 인지 과학적 모방 접근 사이에서 분리되어 발전해 왔으며, 이로 인해 메모리 기술의 핵심적인 진화 논리가 체계적으로 정리되지 못했다 .#Review#LLM Agent#Memory Mechanism#Storage#Reflection#Experience#Continual Learning2026년 5월 10일댓글 수 로딩 중
[논문리뷰] Flow-OPD: On-Policy Distillation for Flow Matching Models본 논문은 Flow Matching 모델의 다중 작업 정렬(multi-task alignment) 과정에서 발생하는 보상 희소성(reward sparsity)과 기울기 간섭(gradient interference) 문제를 해결하고자 합니다.#Review#Flow Matching#On-Policy Distillation#Reinforcement Learning#Multi-task Alignment#Manifold Anchor Regularization#Text-to-Image2026년 5월 10일댓글 수 로딩 중
[논문리뷰] Fast Byte Latent Transformer본 논문은 byte-level language model이 지닌 고질적인 추론 속도 문제를 해결하는 것을 목적으로 한다. 기존의 바이트 단위 모델은 Subword 모델과 달리 입력 길이가 훨씬 길어지기 때문에, Naive한 자기회귀(Autoregressive) 방식으로는 매우 느린 추론 속도를 보인다는 한계가 있다.#Review#Byte-level Language Model#BLT#Diffusion#Inference Acceleration#Speculative Decoding#Latent Tokenization2026년 5월 10일댓글 수 로딩 중
[논문리뷰] Empirical Evidence for Simply Connected Decision Regions in Image Classifiers본 논문은 현대의 deep neural network가 학습한 결정 영역이 단순히 path connected할 뿐만 아니라, 더 강력한 위상적 성질인 simply connected를 만족하는지 규명하고자 한다.#Review#Deep Neural Networks#Decision Regions#Topology#Simply Connected#Coons Patches#Adversarial Robustness2026년 5월 10일댓글 수 로딩 중
[논문리뷰] DecodingTrust-Agent Platform (DTap): A Controllable and Interactive Red-Teaming Platform for AI Agents본 논문은 복잡한 워크플로우를 자동화하는 AI 에이전트의 보안 위협을 체계적으로 평가할 수 있는 표준화된 플랫폼과 벤치마크의 부재 문제를 해결합니다.#Review#AI Agents#Red-Teaming#Safety Evaluation#Agentic Systems#Security Risk Assessment2026년 5월 10일댓글 수 로딩 중
[논문리뷰] CPCANet: Deep Unfolding Common Principal Component Analysis for Domain Generalization본 논문은 기존의 DG 방법들이 데이터 간의 통계적 거리를 정렬하거나 대규모 모델의 표현력에 의존하는 방식에서 벗어나, 도메인 간의 불변 구조를 직접적으로 추출하지 못한다는 한계를 해결하고자 합니다.#Review#Domain Generalization#Common Principal Component Analysis#Deep Unfolding Networks#Riemannian Optimization#Stiefel Manifold2026년 5월 10일댓글 수 로딩 중
[논문리뷰] CASCADE: Case-Based Continual Adaptation for Large Language Models During Deployment현재의 LLM 라이프사이클은 대규모 pretraining과 finetuning이라는 두 단계에 고정되어 있어, 일단 배포되면 학습이 완전히 중단되는 한계가 있습니다.#Review#Large Language Models#Deployment-Time Learning#Case-Based Reasoning#Contextual Bandit#No-Regret Learning#Experiential Learning2026년 5월 10일댓글 수 로딩 중
[논문리뷰] Beyond Retrieval: A Multitask Benchmark and Model for Code Search코드 검색 벤치마크 분야는 데이터 오염, 평가 지표의 단일성, 그리고 실제 배포 환경과 괴리된 평가 방식으로 인해 정교한 모델 성능 측정이 어렵습니다.#Review#Code Search#Benchmark#Reranker#Data Contamination#Retrieval-Augmented Generation#Code LLM2026년 5월 10일댓글 수 로딩 중
[논문리뷰] Anisotropic Modality AlignMLLM 학습은 고품질의 쌍(paired) 멀티모달 데이터 부족이라는 고질적인 문제에 직면해 있으며, 이를 해결하기 위해 공유 임베딩 공간에서 unimodal 데이터를 정렬하는 방식이 주목받고 있다.#Review#Multimodal Large Language Models#Modality Gap#Unpaired Alignment#Anisotropic Geometric Correction#Representation Learning2026년 5월 10일댓글 수 로딩 중
[논문리뷰] AEM: Adaptive Entropy Modulation for Multi-Turn Agentic Reinforcement Learning본 논문은 Agentic RL에서 발생하는 sparse, outcome-level reward 문제를 해결하기 위해 응답 수준에서의 정교한 Credit Assignment 프레임워크를 제안합니다.#Review#Agentic Reinforcement Learning#Credit Assignment#Adaptive Entropy Modulation#Large Language Models#Exploration-Exploitation Trade-off#Surprisal#Policy Optimization2026년 5월 10일댓글 수 로딩 중
[논문리뷰] 4DThinker: Thinking with 4D Imagery for Dynamic Spatial Understanding본 논문은 기존 VLM이 동적 공간 추론에서 겪는 불투명성과 성능 한계를 해결하기 위해 4DThinker를 제안합니다. 기존 연구들은 추론 과정을 텍스트로만 기술하거나 외부 기하학적 모듈을 의존하여 추론 복잡도를 증가시키고 모델 자체의 내재적 능력을 제한하는 한계를 보입니다 .#Review#Vision-Language Models#Dynamic Spatial Reasoning#Latent Mental Imagery#Dynamic-Imagery Fine-Tuning (DIFT)#4D Reinforcement Learning (4DRL)#Chain-of-Thought (CoT)2026년 5월 10일댓글 수 로딩 중