본문으로 건너뛰기

#AI Alignment

4개의 포스트

[논문리뷰] OPV: Outcome-based Process Verifier for Efficient Long Chain-of-Thought Verification

댓글 수 로딩 중

[논문리뷰] Parrot: Persuasion and Agreement Robustness Rating of Output Truth -- A Sycophancy Robustness Benchmark for LLMs

댓글 수 로딩 중