본문으로 건너뛰기

#Multi-turn Interaction

14개의 포스트

[논문리뷰] Healthcare AI GYM for Medical Agents

댓글 수 로딩 중

[논문리뷰] InfoPO: Information-Driven Policy Optimization for User-Centric Agents

댓글 수 로딩 중

[논문리뷰] CoVe: Training Interactive Tool-Use Agents via Constraint-Guided Verification

댓글 수 로딩 중

[논문리뷰] Dr. Kernel: Reinforcement Learning Done Right for Triton Kernel Generations

댓글 수 로딩 중

[논문리뷰] ASTRA: Automated Synthesis of agentic Trajectories and Reinforcement Arenas

댓글 수 로딩 중

[논문리뷰] Agent-R1: Training Powerful LLM Agents with End-to-End Reinforcement Learning

댓글 수 로딩 중

[논문리뷰] RecoWorld: Building Simulated Environments for Agentic Recommender Systems

댓글 수 로딩 중

[논문리뷰] UI-S1: Advancing GUI Automation via Semi-online Reinforcement Learning

댓글 수 로딩 중

[논문리뷰] BIRD-INTERACT: Re-imagining Text-to-SQL Evaluation for Large Language Models via Lens of Dynamic Interactions

댓글 수 로딩 중

[논문리뷰] Test-Time Policy Adaptation for Enhanced Multi-Turn Interactions with LLMs

댓글 수 로딩 중