[논문리뷰] SNLP: Layer-Parallel Inference via Structured Newton Corrections본 논문은 Transformer 모델의 고질적인 문제인 Layer-wise Dependency로 인한 추론 지연(Latency) 문제를 해결하고자 합니다.#Review#Layer-Parallel Inference#Structured Newton Corrections#Transformer#Autoregressive#Solver-induced Inference Bias#Identity Newton#HC Newton2026년 5월 18일댓글 수 로딩 중