#Underparameterization

1개의 포스트

[논문리뷰] Specialization after Generalization: Towards Understanding Test-Time Training in Foundation Models

본 논문은 대규모 파운데이션 모델에서 Test-Time Training (TTT) 의 효과를 심층적으로 이해하고, 특히 모델이 이미 학습한 in-distribution 데이터 에 대해서도 TTT가 성능 향상을 가져올 수 있는지 규명하는 것을 목표로 합니다.

#Review #Test-Time Training (TTT)#Foundation Models #Underparameterization #Sparse Autoencoders (SAE)#Linear Representation Hypothesis (LRH)#Specialization #Scaling Laws #In-Distribution Data

2025년 10월 1일