#Long-Context Modeling

5개의 포스트

[논문리뷰] MiMo-V2-Flash Technical Report

arXiv에 게시된 'MiMo-V2-Flash Technical Report' 논문에 대한 자세한 리뷰입니다.

#Review #Mixture-of-Experts #Sliding Window Attention #Multi-Token Prediction #Multi-Teacher On-Policy Distillation #Reinforcement Learning #Long-Context Modeling #Agentic AI

2026년 1월 6일

[논문리뷰] Fast-weight Product Key Memory

arXiv에 게시된 'Fast-weight Product Key Memory' 논문에 대한 자세한 리뷰입니다.

#Review #Fast-weight Memory #Product Key Memory #Episodic Memory #Language Models #Long-Context Modeling #Memory Augmented Networks #Continual Learning

2026년 1월 4일

[논문리뷰] Kimi Linear: An Expressive, Efficient Attention Architecture

arXiv에 게시된 'Kimi Linear: An Expressive, Efficient Attention Architecture' 논문에 대한 자세한 리뷰입니다.

#Review #Linear Attention #Hybrid Architecture #Kimi Delta Attention (KDA)#Gating Mechanism #Long-Context Modeling #Efficient Inference #Transformer

2025년 10월 31일

[논문리뷰] Glyph: Scaling Context Windows via Visual-Text Compression

Wenyi Hong이 arXiv에 게시한 'Glyph: Scaling Context Windows via Visual-Text Compression' 논문에 대한 자세한 리뷰입니다.

#Review #Long-Context Modeling #Visual Compression #Vision-Language Models #Token Efficiency #Genetic Algorithms #Multimodal AI #LLM Scaling

2025년 10월 21일

[논문리뷰] Artificial Hippocampus Networks for Efficient Long-Context Modeling

arXiv에 게시된 'Artificial Hippocampus Networks for Efficient Long-Context Modeling' 논문에 대한 자세한 리뷰입니다.

#Review #Long-Context Modeling #Transformer #RNN #Memory Management #Self-Distillation #Attention Mechanism #Artificial Hippocampus Networks #Cognitive Science

2025년 10월 9일