#Corpus Curation

1개의 포스트

[논문리뷰] Decouple Searching from Training: Scaling Data Mixing via Model Merging for Large Language Model Pre-training

Large Language Model (LLM) 사전 학습에서 효과적인 데이터 혼합 비율을 결정하는 것은 여전히 어려운 문제입니다.

#Review #LLM Pre-training #Data Mixture Optimization #Model Merging #Proxy Models #Resource Efficiency #DeMix #Corpus Curation

2026년 2월 3일