#ScaleRL

1개의 포스트

[논문리뷰] The Art of Scaling Reinforcement Learning Compute for LLMs

본 연구는 LLM 훈련에 필수적인 RL(강화 학습)의 확장(Scaling) 특성에 대한 예측 방법론이 부족하다는 문제를 해결하고자 합니다.

#Review #Reinforcement Learning #LLMs #Scaling Laws #Compute Efficiency #Predictability #Sigmoidal Curves #ScaleRL #Off-Policy RL

2025년 10월 16일