[논문리뷰] AutoMedBench: Towards Medical AutoResearch with Agentic AI Models본 논문은 기존 의료 AI 벤치마크가 End-to-End 연구 과정의 복잡성을 간과하고 최종 결과물 평가에만 치중하여, 에이전트의 행동 특성이나 실패 원인을 파악하기 어렵다는 문제점을 해결하고자 합니다 .#Review#Medical-AI#Autonomous Agents#Benchmark#Research Automation#Workflow-Aware Evaluation#LLM2026년 6월 2일댓글 수 로딩 중
[논문리뷰] OmniScientist: Toward a Co-evolving Ecosystem of Human and AI Scientists기존 AI Scientist 시스템이 과학적 발견을 독립적인 검색/최적화 문제로만 보고, 과학 연구의 사회적, 협력적 특성을 간과하는 한계를 해결합니다.#Review#AI Scientist#Large Language Models (LLMs)#Human-AI Collaboration#Scientific Ecosystem#Research Automation#Omni Scientific Protocol (OSP)#ScienceArena#Knowledge Graph2025년 11월 23일댓글 수 로딩 중
[논문리뷰] Universal Deep Research: Bring Your Own Model and Strategy이 논문은 기존의 심층 연구 도구(DRT)들이 고정된 연구 전략과 제한적인 모델 선택으로 인해 사용자 정의가 어렵고 특정 산업에 특화된 연구 전략을 구축하기 어렵다는 문제를 제기합니다.#Review#Agentic Systems#Language Models (LLMs)#Research Automation#Customizable Strategies#Code Generation#Deep Research#User-Defined Agents#Sandboxed Execution2025년 9월 3일댓글 수 로딩 중
[논문리뷰] Spacer: Towards Engineered Scientific InspirationSpacer는 기존 LLM의 한계인 제한된 창의성과 문맥 의존성을 극복하여 외부 개입 없이 창의적이고 사실에 기반한 과학적 개념을 생성하는 것을 목표로 합니다.#Review#Scientific Discovery#Large Language Models (LLMs)#Decontextualization#Keyword Graph#Multi-Agent System#Scientific Ideation#Research Automation#Inspiration Engine2025년 8월 27일댓글 수 로딩 중
[논문리뷰] Understanding DeepResearch via Reports본 논문은 지식 집약적 연구 작업을 수행하는 DeepResearch 에이전트 의 복합적인 평가 문제에 주목합니다.#Review#DeepResearch Agents#LLM-as-a-Judge#Report Evaluation#Agentic AI#Factuality#Redundancy#Research Automation#Benchmark2025년 10월 13일댓글 수 로딩 중