[논문리뷰] Endless Terminals: Scaling RL Environments for Terminal Agents본 논문은 자체 개선 에이전트 훈련을 위한 환경이 부족하다는 문제점을 해결하고, 확장 가능한 RL 환경을 제공하는 것을 목표로 합니다.#Review#Reinforcement Learning#Procedural Generation#Terminal Agents#Environment Scaling#Language Models (LLMs)#PPO#Task Generation#Automated Verification2026년 1월 25일댓글 수 로딩 중
[논문리뷰] Towards General Agentic Intelligence via Environment Scaling본 논문은 일반 에이전트 지능(General Agentic Intelligence)을 발전시키기 위해 대규모 언어 모델(LLM)의 함수 호출 능력 을 향상시키는 것을 목표로 합니다.#Review#Agentic AI#Environment Scaling#Function Calling#Tool Use#Large Language Models#Synthetic Data Generation#Supervised Fine-tuning2025년 9월 17일댓글 수 로딩 중