[논문리뷰] Revisiting DAgger in the Era of LLM-Agents본 논문은 장기 상호작용을 수행하는 LLM 에이전트의 사후 학습(Post-training) 단계에서 발생하는 고질적인 분포 불일치 문제를 해결하고자 합니다.#Review#LLM-Agents#DAgger#Covariate Shift#Multi-Turn Interaction#Post-Training#Imitation Learning2026년 5월 13일댓글 수 로딩 중