[논문리뷰] Bag of Dims: Training-Free Mechanistic Interpretability via Dimension-Level Sign Patterns본 논문은 Transformer의 내부 연산 과정을 해석하기 위해 별도의 해석 모델을 훈련해야 하는 기존 방식의 비효율성을 해결하고자 한다.#Review#Mechanistic Interpretability#Transformer#Standard Basis#Dimension-Level#Feature Discovery#Sign Patterns#Zero-Training2026년 6월 17일댓글 수 로딩 중