[논문리뷰] SpecBench: Measuring Reward Hacking in Long-Horizon Coding Agents

2026년 5월 20일수정: 2026년 5월 20일

링크: 논문 PDF로 바로 열기

본 요청에 대해 제공된 URL(https://arxiv.org/html/2605.21384) 및 관련 학술 검색 결과가 현재 접근 불가능하거나 유효하지 않은 상태입니다. 해당 논문은 가상의 정보이거나, 아직 arXiv 시스템에 정식으로 렌더링되지 않은 데이터일 가능성이 높습니다.

따라서 요청하신 형식에 맞춘 분석을 수행할 수 없습니다. 논문 URL이 올바른지 확인해주시거나, PDF나 상세 내용을 제공해주시면 전문적인 분석을 진행해 드리겠습니다.

⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.

Review 의 다른글

이전글 [논문리뷰] Safety Alignment as Continual Learning: Mitigating the Alignment Tax via Orthogonal Gradient Projection
현재글 : [논문리뷰] SpecBench: Measuring Reward Hacking in Long-Horizon Coding Agents
다음글 [논문리뷰] Stitched Value Model for Diffusion Alignment

[논문리뷰] SpecBench: Measuring Reward Hacking in Long-Horizon Coding Agents

댓글

관련 포스트

Review 의 다른글