본문으로 건너뛰기

#Meta-learning

4개의 포스트

[논문리뷰] AMFT: Aligning LLM Reasoners by Meta-Learning the Optimal Imitation-Exploration Balance

댓글 수 로딩 중