[논문리뷰] SciAtlas: A Large-Scale Knowledge Graph for Automated Scientific Research본 연구는 급증하는 과학적 문헌의 양으로 인해 인간 연구자가 최신 지식을 통합적으로 이해하고 활용하는 데 한계가 있다는 점을 지적합니다. 기존의 개별 논문 분석 중심 접근법은 과학적 지식 간의 유기적인 연결(Interdisciplinary Connection)을 포착하지 못한다는 단점이 있습니다.#Review#Knowledge Graph#Scientific Research#Automated Discovery#Large-Scale#Information Extraction#Scientific Reasoning2026년 5월 24일댓글 수 로딩 중
[논문리뷰] SciVideoBench: Benchmarking Scientific Video Reasoning in Large Multimodal Models기존 비디오 벤치마크들이 일반 시나리오와 단순 추론에 집중하여 최신 대규모 멀티모달 모델(LMM) 의 고급 인지 능력을 평가하는 데 한계가 있음을 지적하며, 과학 분야에서의 복잡한 비디오 추론 능력을 종합적으로 평가할 수 있는 엄격한 벤치마크인 SciVideoBench 를 구축하는 것을 목표로 합니다.#Review#Video Reasoning#Multimodal AI#Scientific Research#Large Multimodal Models#Benchmark#Quantitative Reasoning#Domain Knowledge#Visual Grounding2025년 10월 10일댓글 수 로딩 중
[논문리뷰] AstaBench: Rigorous Benchmarking of AI Agents with a Scientific Research Suite본 논문은 과학 연구 분야 AI 에이전트의 기존 벤치마크 평가 방식이 지닌 한계점(예: 비현실적인 측정, 재현성 부족, 비용 미반영 등)을 극복하고자 합니다.#Review#AI Agents#Benchmarking#Scientific Research#LLM Evaluation#Agentic AI#Tool Use#Reproducibility#Cost-Aware Evaluation2025년 10월 27일댓글 수 로딩 중