[논문리뷰] SkillOrchestra: Learning to Route Agents via Skill Transfer논문은 복합 AI 시스템에서 효과적인 오케스트레이션 문제를 해결하고자 합니다.#Review#Agent Orchestration#Skill Transfer#LLM Routing#Performance-Cost Trade-off#Routing Collapse#Multi-turn Dialogue#Skill Handbook#Reinforcement Learning2026년 2월 23일댓글 수 로딩 중
[논문리뷰] Knowledge is Not Enough: Injecting RL Skills for Continual Adaptation대규모 언어 모델(LLMs)이 겪는 '지식 단절(knowledge cutoff)' 문제와, 지도 미세 조정(SFT)이 새로운 지식 통합 시 추론 능력 향상에 한계가 있으며, 강화 학습(RL)은 온라인 적응에 비실용적으로 비싼 비용 문제를 해결하는 것이 목표입니다.#Review#LLMs#Continual Adaptation#Reinforcement Learning#Supervised Fine-Tuning#Skill Transfer#Task Arithmetic#Tool Use2026년 1월 25일댓글 수 로딩 중