[논문리뷰] ProRL Agent: Rollout-as-a-Service for RL Training of Multi-Turn LLM AgentsMulti-turn LLM Agents는 복잡하고 인터랙티브한 작업을 해결하는 데 점차 중요해지고 있으며, Reinforcement Learning (RL)은 long-horizon behavior를 개선하는 데 핵심적인 역할을 합니다.#Review#Multi-turn LLM Agents#Reinforcement Learning#Rollout-as-a-Service#Training-Rollout Decoupling#Sandbox Environments#HPC#Token-in/Token-out#Scalability2026년 3월 19일댓글 수 로딩 중