[논문리뷰] OpenBioRQ: Unsolved Biomedical Research Questions for Agents본 논문은 기존의 LLM 평가 벤치마크들이 정해진 정답(ground-truth)이 있는 질문들만을 다룸으로써, 실제 환경에서 발생하는 치명적인 오류 유형을 간과하고 있다는 문제를 제기합니다 .#Review#Biomedical Research#Agentic Evaluation#Retrieval-Grounded#Faithfulness#Citation Factuality#Open Questions2026년 6월 25일댓글 수 로딩 중