#Recurrent Neural Networks

7개의 포스트

[논문리뷰] Gated DeltaNet-2: Decoupling Erase and Write in Linear Attention

본 논문은 Linear Attention 기반 모델들에서 메모리 편집의 핵심인 erase(제거)와 write(삽입) 동작이 단일 scalar gate에 의해 묶여 있는 구조적 한계를 해결하고자 합니다.

#Review #Linear Attention #Recurrent Neural Networks #Delta Rule #Fast-Weight Memory #Selective State Space #Chunkwise Parallel Training #Long-Context Retrieval

2026년 5월 21일

[논문리뷰] WriteSAE: Sparse Autoencoders for Recurrent State

본 논문은 기존의 Residual SAE가 해결하지 못했던 state-space 및 hybrid recurrent language model의 matrix cache write 문제를 다룬다.

#Review #Sparse Autoencoders #State-Space Models #Recurrent Neural Networks #Mechanistic Interpretability #Cache-Patching #WriteSAE

2026년 5월 13일

[논문리뷰] Memory Caching: RNNs with Growing Memory

본 논문은 고정된 메모리 크기 로 인해 장문 시퀀스에서 과거 정보를 잊어버리는 Recurrent Neural Networks (RNNs)의 한계를 해결하고자 합니다.

#Review #Recurrent Neural Networks #Memory Caching #Sequence Modeling #Long-Context #Transformers #Linear Attention #Language Modeling #Retrieval Tasks

2026년 3월 1일

[논문리뷰] Recurrent-Depth VLA: Implicit Test-Time Compute Scaling of Vision-Language-Action Models via Latent Iterative Reasoning

기존 VLA 모델의 고정된 연산 깊이로 인한 비효율성과 토큰 기반 추론의 메모리 및 연속적인 액션 공간 한계를 해결합니다. 태스크 복잡도에 따라 테스트 시 연산량을 동적으로 조절 하고, 일정한 메모리 공간 을 유지하며 로봇 제어 를 위한 효율적인 추론 메커니즘을 제공하는 것을 목표로 합니다.

#Review #Vision-Language-Action Models #Latent Iterative Reasoning #Adaptive Compute #Recurrent Neural Networks #Robotics #Transformer #Test-Time Scaling #Continuous Action Space

2026년 2월 9일

[논문리뷰] Universal Reasoning Model

본 연구는 Universal Transformer (UT) 모델이 ARC-AGI 와 같은 복잡한 추론 태스크에서 성능 향상을 보이는 근본적인 원인을 체계적으로 분석하는 것을 목표로 합니다.

#Review #Universal Transformer #Recurrent Neural Networks #ARC-AGI #Reasoning Tasks #Nonlinearity #Convolutional Gating #Truncated Backpropagation #Model Efficiency

2025년 12월 17일

[논문리뷰] QKAN-LSTM: Quantum-inspired Kolmogorov-Arnold Long Short-term Memory

본 연구는 기존 LSTM 모델 의 높은 파라미터 중복성과 제한된 비선형 표현력 문제를 해결하고, 특히 도시 통신 예측과 같은 복잡한 시계열 모델링 태스크에서 성능을 향상시키는 것을 목표로 합니다.

#Review #Quantum Machine Learning #Kolmogorov-Arnold Networks #Long Short-Term Memory (LSTM)#Time Series Forecasting #Hybrid Quantum-Classical Learning #Quantum-inspired #Recurrent Neural Networks

2025년 12월 4일

[논문리뷰] Flow Equivariant Recurrent Neural Networks

본 논문은 기존 정적 변환 및 피드포워드 네트워크 에 국한된 equivariance 이론을 확장하여, 시각적 움직임과 같은 시간 매개변수화된 흐름(flows)을 포착하는 순환 신경망(RNN) 에 적용하는 것을 목표로 합니다.

#Review #Flow Equivariance #Recurrent Neural Networks #Sequence Models #Group Equivariance #Lie Subgroups #Generalization #Time-Parameterized Symmetries

2025년 8월 2일