[논문리뷰] ASTRA: Automated Synthesis of agentic Trajectories and Reinforcement Arenas논문은 도구-증강 언어 모델 에이전트 훈련의 어려움(수동 개입, 검증 불가능한 시뮬레이션 환경, 불안정한 장기/다중 턴 학습)을 해결하기 위해 완전히 자동화된 종단 간 프레임워크 ASTRA 를 제안합니다.#Review#LLM Agent#Tool Use#Trajectory Synthesis#Reinforcement Learning#Environment Synthesis#Data Generation#Multi-turn Interaction#Automated Training2026년 2월 1일댓글 수 로딩 중
[논문리뷰] Training Language Model Agents to Find Vulnerabilities with CTF-Dojo본 논문은 대규모 언어 모델(LLM) 에이전트를 활용하여 사이버 보안 취약점을 자동으로 탐지하고 악용하는 것을 목표로 합니다.#Review#LLM Agents#Cybersecurity#CTF Challenges#Vulnerability Detection#Execution Environments#Docker#Automated Training#Verifiable Feedback2025년 8월 27일댓글 수 로딩 중