#Autoregressive Decoding

1개의 포스트

[논문리뷰] Demystifying When Pruning Works via Representation Hierarchies

본 논문은 Network Pruning이 비생성적(non-generative) 태스크에서는 성능을 잘 유지하는 반면, 생성적(generative) 태스크에서는 흔히 실패한다는 현상의 근본 원인을 규명합니다. 기존의 Pruning 연구들은 태스크 유형에 따른 이러한 상이한 성능 양상을 체계적으로 설명하지 못했습니다.

#Review #Network Pruning #Large Language Models #Representation Hierarchy #Autoregressive Decoding #Softmax Nonlinearity

2026년 4월 7일