#AI Research Agents

4개의 포스트

[논문리뷰] AI Research Agents Narrow Scientific Exploration

본 연구는 AI 연구 에이전트가 과학적 발견의 범위를 실질적으로 확장하는지, 아니면 기존 연구의 주변부에 머무르는지를 규명하는 것을 목적으로 합니다.

#Review #AI Research Agents #Scientific Discovery #Ideation #Citation Analysis #Research Breadth #Bibliographic Coupling

2026년 5월 27일

[논문리뷰] AIRS-Bench: a Suite of Tasks for Frontier AI Research Science Agents

본 논문의 핵심 목표는 LLM 에이전트의 과학 연구 역량을 종합적으로 평가할 수 있는 표준화된 벤치마크인 AIRS-BENCH 를 도입하는 것입니다.

#Review #AI Research Agents #LLM Agents #Machine Learning Benchmarks #Scientific Discovery #Code Generation #Evaluation Metrics #Scaffolds #Reproducibility

2026년 2월 9일

[논문리뷰] AI & Human Co-Improvement for Safer Co-Superintelligence

이 논문은 AI가 스스로 개선하는 자율적 자기 개선(Self-Improving AI)의 목표가 위험하고 최적의 경로가 아니라고 주장하며, 대신 인간과 AI의 협력적 공동 개선(Co-Improvement) 을 통해 더 안전하고 빠른 공동 초지능(Co-Superintelligence) 달성을 제안합니다.

#Review #AI Safety #Superintelligence #Human-AI Collaboration #Self-Improving AI #Co-Improvement #Alignment #AI Research Agents

2025년 12월 7일

[논문리뷰] What Does It Take to Be a Good AI Research Agent? Studying the Role of Ideation Diversity

AI 연구 에이전트의 성능에 있어 아이디어 다양성(ideation diversity)이 핵심 병목 현상인지를 규명하고, 에이전트 궤적의 성공 또는 실패를 좌우하는 요인을 이해하는 것을 목표로 합니다.

#Review #AI Research Agents #Ideation Diversity #MLE-bench #LLM Backbones #Agentic Scaffolds #Shannon Entropy #Machine Learning Engineering #Performance Metrics

2025년 11월 19일