#Dynamic Thresholding

1개의 포스트

[논문리뷰] FlashPrefill: Instantaneous Pattern Discovery and Thresholding for Ultra-Fast Long-Context Prefilling

Large Language Models (LLMs)의 장문 컨텍스트 처리 시 자기회귀(self-attention)의 2차 복잡도로 인한 성능 병목현상 , 특히 계산 집약적인 프리필(prefilling) 단계의 높은 오버헤드 를 해결하는 것이 목표입니다.

#Review #Long-Context LLMs #Prefilling #Sparse Attention #Pattern Discovery #Dynamic Thresholding #Attention Speedup #Transformer Optimization

2026년 3월 8일