[논문리뷰] PRL-Bench: A Comprehensive Benchmark Evaluating LLMs' Capabilities in Frontier Physics Research본 논문은 기존 벤치마크들이 실제 과학 연구의 핵심인 탐색적 성격과 절차적 복잡성을 제대로 평가하지 못하는 문제를 해결하고자 한다.#Review#PRL-Bench#LLMs#Scientific Benchmarks#Physics Research#End-to-End Workflow#Long-horizon Reasoning#Agentic Science2026년 4월 19일댓글 수 로딩 중