[논문리뷰] AutoMedBench: Towards Medical AutoResearch with Agentic AI Models본 논문은 기존 의료 AI 벤치마크가 End-to-End 연구 과정의 복잡성을 간과하고 최종 결과물 평가에만 치중하여, 에이전트의 행동 특성이나 실패 원인을 파악하기 어렵다는 문제점을 해결하고자 합니다 .#Review#Medical-AI#Autonomous Agents#Benchmark#Research Automation#Workflow-Aware Evaluation#LLM2026년 6월 2일댓글 수 로딩 중