[논문리뷰] Same Architecture, Different Capacity: Optimizer-Induced Spectral Scaling Laws본 논문은 기존의 스케일링 법칙이 최적화기(optimizer)를 고정된 요소로 간주하여, 모델 내부 표현의 구조적 차이를 간과한다는 점을 문제로 지적합니다. 저자들은 동일한 아키텍처와 컴퓨팅 자원을 사용하더라도 최적화기 선택에 따라 FFN 폭이 실제 유효 용량으로 전환되는 효율이 크게 달라질 수 있음을 밝힙니다 .#Review#Spectral Scaling Laws#Optimizer Geometry#Effective Rank#FFN Width#Representation Scaling2026년 5월 21일댓글 수 로딩 중