#Dimension-Level

1개의 포스트

[논문리뷰] Bag of Dims: Training-Free Mechanistic Interpretability via Dimension-Level Sign Patterns

본 논문은 Transformer의 내부 연산 과정을 해석하기 위해 별도의 해석 모델을 훈련해야 하는 기존 방식의 비효율성을 해결하고자 한다.

#Review #Mechanistic Interpretability #Transformer #Standard Basis #Dimension-Level #Feature Discovery #Sign Patterns #Zero-Training

2026년 6월 17일