#Human-AI Collaboration

16개의 포스트

[논문리뷰] From Human-Centric to Agentic Code Review: The Impact of Different Generations of Generative AI Technology on Review Quality

본 논문은 Generative AI 기술이 소프트웨어 개발 생태계에 깊숙이 침투함에 따라, 기존의 Human-Centric 코드 리뷰가 LLM 및 AI Agent가 결합된 형태로 변화하면서 발생하는 리뷰 품질 및 효율성 변화를 규명하고자 합니다 .

#Review #Generative AI #Code Review #LLM #AI Agents #Review Quality #Human-AI Collaboration #Software Engineering

2026년 7월 19일

[논문리뷰] A Benchmark and Framework for Evaluating Next Action Predictions in Spreadsheets

본 논문은 스프레드시트 환경에서 부족한 자동 완성(auto-completion) 기능을 보완하기 위해 차세대 작업 예측을 위한 벤치마크와 평가 프레임워크를 제안합니다. 기존의 코드 자동 완성 연구와 달리, 스프레드시트는 공개적인 편집 기록(edit history) 데이터가 부족하고 작업 공간이 복잡하다는 한계가 있습니다.

#Review #Spreadsheet Automation #Next Action Prediction #Benchmark #Online Evaluation #Human-AI Collaboration #Code Completion

2026년 6월 17일

[논문리뷰] AutoResearch AI: Towards AI-Powered Research Automation for Scientific Discovery

본 연구는 AI가 과학 연구의 개별 작업을 지원하는 task-level AI for Science를 넘어 workflow-level research automation으로 전환되는 현상 속에서 발생하는 분야의 파편화 문제를 해결하고자 한다.

#Review #AutoResearch #AI for Science #Workflow Automation #Scientific Discovery #Autonomy Spectrum #Human-AI Collaboration #Evaluation Framework #Scientific Credibility

2026년 5월 25일

[논문리뷰] Investigating Autonomous Agent Contributions in the Wild: Activity Patterns and Code Change over Time

본 논문은 급증하는 Autonomous Coding Agents 가 오픈소스 소프트웨어 생태계에 미치는 실질적인 영향과 그 결과물인 코드의 품질을 실증적으로 분석하는 것을 목표로 합니다.

#Review #Autonomous Coding Agents #Large Language Models #Mining Software Repositories #Pull Requests #Code Churn #Empirical Software Engineering #Human-AI Collaboration

2026년 4월 2일

[논문리뷰] AgentDS Technical Report: Benchmarking the Future of Human-AI Collaboration in Domain-Specific Data Science

본 논문은 도메인 특화 Data Science 태스크에서 AI 에이전트가 인간 전문가의 성능을 어느 수준까지 대체할 수 있는지, 그리고 어떤 영역에서 인간의 전문성이 여전히 우위를 지니는지 평가하기 위한 벤치마크 AgentDS를 제안합니다.

#Review #AI Agents #Human-AI Collaboration #Data Science Benchmark #Large Language Models #Domain-Specific Reasoning #Multi-Industry Evaluation

2026년 3월 22일

[논문리뷰] AIDev: Studying AI Coding Agents on GitHub

AI 코딩 에이전트가 실제 소프트웨어 프로젝트에서 어떻게 활용되는지에 대한 포괄적인 데이터셋의 부재를 해결하는 것이 이 연구의 핵심 목표입니다. AIDev 라는 대규모 데이터셋을 구축하여 AI 도입, 개발자 생산성, 그리고 인간-AI 협업이라는 새로운 소프트웨어 엔지니어링 시대의 연구를 위한 기반을 마련하고자 합니다.

#Review #AI Coding Agents #GitHub Data #Software Engineering #Pull Request Analysis #Human-AI Collaboration #Developer Productivity #Large Language Models

2026년 2월 16일

[논문리뷰] Towards Autonomous Mathematics Research

본 논문은 국제 수학 올림피아드(IMO) 수준을 넘어 전문적인 수학 연구 영역으로 AI의 능력을 확장하는 것을 목표로 합니다. 방대한 문헌 탐색과 장기적인 증명 구성이 요구되는 연구 문제 해결을 위해, 자연어로 솔루션을 반복적으로 생성, 검증, 수정하는 수학 연구 에이전트 Aletheia 를 소개합니다.

#Review #Mathematics Research #Large Language Models #AI Agents #Theorem Proving #Tool Use #Gemini Deep Think #Autonomous Research #Human-AI Collaboration

2026년 2월 11일

[논문리뷰] Steering LLMs via Scalable Interactive Oversight

본 논문은 대규모 언어 모델(LLM)이 복잡하고 장기적인 태스크를 자동화함에 따라 발생하는 '감독 격차(supervision gap)' 문제를 해결하고자 합니다. 이는 비전문가 사용자가 충분한 도메인 전문성 없이 AI 시스템을 효과적으로 조종하고 복잡한 출력을 검증하기 어려운 문제를 지칭합니다.

#Review #Scalable Oversight #Interactive AI #Large Language Models #Human-AI Collaboration #Product Requirement Documents #Reinforcement Learning #Structured Interaction #Vibe Coding

2026년 2월 5일

[논문리뷰] MeepleLM: A Virtual Playtester Simulating Diverse Subjective Experiences

본 논문은 LLM이 보드게임 디자인에 대한 건설적인 비판을 제공하는 데 있어 나타나는 핵심적인 한계를 해결하고자 합니다. 특히, 정적 규칙에서 잠재된 게임플레이 역학을 추론하고 다양한 플레이어 그룹의 주관적인 경험 이질성을 모델링하여, 기존 시스템이 부족했던 사용자 경험 기반의 피드백을 자동화하는 것을 목표로 합니다.

#Review #Large Language Models #Board Games #Virtual Playtester #User Simulation #Persona Modeling #MDA Framework #Human-AI Collaboration #Critique Generation

2026년 1월 25일

[논문리뷰] Numina-Lean-Agent: An Open and General Agentic Reasoning System for Formal Mathematics

기존 에이전트 기반 형식 증명 시스템의 유연성, 재현성, 확장성 한계를 해결하고자 합니다.

#Review #Agentic Systems #Formal Theorem Proving #Large Language Models (LLMs)#Lean Theorem Prover #Multi-Agent Systems #Code Generation #Automated Reasoning #Human-AI Collaboration

2026년 1월 21일

[논문리뷰] Facilitating Proactive and Reactive Guidance for Decision Making on the Web: A Design Probe with WebSeek

컴퓨터 비전 태스크에서 CNN의 의존성을 완전히 제거 하고, 순수한 Transformer 아키텍처 만으로 이미지 분류 성능을 달성하는 것을 목표로 합니다. 기존 CNN 기반 접근법의 한계를 극복하고 self-attention 메커니즘 이 이미지 패치 간의 관계를 효과적으로 학습할 수 있음을 증명하고자 합니다.

#Review #Mixed-Initiative AI #Human-AI Collaboration #Web Data Analysis #Proactive Guidance #Large Language Models (LLMs)#Browser Extension #Data-Centric Design

2026년 1월 21일

[논문리뷰] AI & Human Co-Improvement for Safer Co-Superintelligence

이 논문은 AI가 스스로 개선하는 자율적 자기 개선(Self-Improving AI)의 목표가 위험하고 최적의 경로가 아니라고 주장하며, 대신 인간과 AI의 협력적 공동 개선(Co-Improvement) 을 통해 더 안전하고 빠른 공동 초지능(Co-Superintelligence) 달성을 제안합니다.

#Review #AI Safety #Superintelligence #Human-AI Collaboration #Self-Improving AI #Co-Improvement #Alignment #AI Research Agents

2025년 12월 7일

[논문리뷰] OmniScientist: Toward a Co-evolving Ecosystem of Human and AI Scientists

기존 AI Scientist 시스템이 과학적 발견을 독립적인 검색/최적화 문제로만 보고, 과학 연구의 사회적, 협력적 특성을 간과하는 한계를 해결합니다.

#Review #AI Scientist #Large Language Models (LLMs)#Human-AI Collaboration #Scientific Ecosystem #Research Automation #Omni Scientific Protocol (OSP)#ScienceArena #Knowledge Graph

2025년 11월 23일

[논문리뷰] AsyncVoice Agent: Real-Time Explanation for LLM Planning and Reasoning

본 논문은 대규모 언어 모델(LLM)의 복잡한 추론 과정(Chain-of-Thought, CoT)이 현재 모놀리식 텍스트 기반으로 제공되어, 음성 인터페이스에서 실시간 상호작용과 사용자 개입을 어렵게 하는 문제를 해결하고자 합니다.

#Review #Real-Time Interaction #Asynchronous Agents #LLM Explanation #Human-AI Collaboration #Voice Interface #Planning and Reasoning #Context Management #Interruption Handling

2025년 10월 21일

[논문리뷰] Foundation Models for Scientific Discovery: From Paradigm Enhancement to Paradigm Transition

본 논문은 GPT-4 및 AlphaFold와 같은 파운데이션 모델(FMs) 이 과학 연구의 기존 방법론을 단순히 개선하는 것을 넘어, 새로운 과학 패러다임으로의 전환을 촉진하고 있다는 주장을 제시합니다.

#Review #Foundation Models #Scientific Discovery #Paradigm Shift #Human-AI Collaboration #Autonomous Agents #Meta-Science #Experimental Design #Hypothesis Generation

2025년 10월 20일

[논문리뷰] A Survey of Vibe Coding with Large Language Models

본 논문은 대규모 언어 모델(LLM)의 발전에 따라 등장한 '바이브 코딩(Vibe Coding)' 이라는 새로운 개발 방법론을 심층적으로 탐구합니다.

#Review #Vibe Coding #Large Language Models #Coding Agents #Human-AI Collaboration #Software Engineering #Development Models #Context Engineering

2025년 10월 15일