[논문리뷰] Socratic-SWE: Self-Evolving Coding Agents via Trace-Derived Agent Skills본 연구는 LLM 기반 소프트웨어 엔지니어링 에이전트가 고품질 태스크 데이터 부족으로 인해 학습 및 일반화 성능이 제한되는 문제를 해결하고자 합니다. 기존 합성 데이터 생성 방식은 고정된 규칙이나 무작위 버그 주입에 의존하여 에이전트의 실제 취약점이나 학습 진행 상황을 반영하지 못한다는 한계가 있습니다.#Review#Software Engineering#Large Language Models#Reinforcement Learning#Self-Evolution#Agent Skills#Trace-Driven Learning#Code Repair2026년 6월 7일댓글 수 로딩 중
[논문리뷰] The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence본 논문은 large language model (LLM)이 long-horizon agentic workflow로 전환됨에 따라 발생하는 efficiency 및 cost bottleneck 문제와 intrinsically complex, high-stakes task 해결의 어려움을 다룹니다.#Review#Mixture-of-Experts (MoE)#Mini Activations#Agentic AI#Self-Evolution#Reinforcement Learning (RL)#Multi-Token Prediction (MTP)2026년 5월 26일댓글 수 로딩 중
[논문리뷰] RewardHarness: Self-Evolving Agentic Post-Training본 논문은 기존의 Reward Modeling 방식이 대규모 인간 피드백 데이터에 의존하여 비용이 높고, 유연성이 부족하다는 문제점을 해결하고자 합니다.#Review#Reward Modeling#Agentic AI#Self-Evolution#Multimodal Evaluation#In-Context Learning#Reinforcement Learning2026년 5월 14일댓글 수 로딩 중
[논문리뷰] Beyond Individual Intelligence: Surveying Collaboration, Failure Attribution, and Self-Evolution in LLM-based Multi-Agent Systems본 논문은 LLM 기반 멀티 에이전트 시스템이 고도로 복잡해짐에 따라 발생하는 비예측적 장애와 구조적 경직성 문제를 해결하기 위해 작성되었습니다.#Review#LLM-based Agents#Multi-Agent Systems#Multi-Agent Collaboration#Failure Attribution#Self-Evolution2026년 5월 14일댓글 수 로딩 중
[논문리뷰] SpatialEvo: Self-Evolving Spatial Intelligence via Deterministic Geometric Environments본 논문은 3D 공간 추론 학습에서 데이터 주석(annotation) 비용과 모델 합의(consensus) 기반 학습의 한계 문제를 해결하고자 합니다.#Review#Spatial Reasoning#Self-Evolution#Vision-Language Models#Deterministic Geometric Environment#Reinforcement Learning2026년 4월 15일댓글 수 로딩 중
[논문리뷰] MemMA: Coordinating the Memory Cycle through Multi-Agent Reasoning and In-Situ Self-EvolutionLarge Language Models (LLMs) 기반의 Agent들이 장기적인 상호작용을 지원하기 위해 외부 메모리 뱅크를 활용하지만, 대부분의 기존 시스템은 메모리 Construction , Retrieval , Utilization 단계를 개별적인 서브루틴으로 분리하여 처리하는 한계를 가집니다.#Review#LLM Agents#Memory Cycle#Multi-Agent Reasoning#Self-Evolution#Long-Horizon Memory#Strategic Blindness#Memory Management2026년 3월 26일댓글 수 로딩 중
[논문리뷰] MM-Zero: Self-Evolving Multi-Model Vision Language Models From Zero Data본 논문은 Vision Language Models (VLMs)의 자기 개선 과정에서 필요한 시각적 데이터의 의존성을 완전히 제거하고, 제로 데이터(zero-data) 환경에서 스스로 진화하는(self-evolving) 멀티모달 추론 능력을 개발하는 것을 목표로 합니다.#Review#Vision-Language Models#Self-Evolution#Reinforcement Learning#Zero-Data#Multi-Agent Systems#Code Generation#Synthetic Data2026년 3월 10일댓글 수 로딩 중
[논문리뷰] EvoFSM: Controllable Self-Evolution for Deep Research with Finite State MachinesLLM 기반 에이전트가 심층 연구 과정에서 겪는 고정된 워크플로우 의 한계와 무제한적인 자기 진화 로 인한 불안정성(instruction drift, hallucination) 문제를 해결하는 것입니다.#Review#LLM Agents#Self-Evolution#Finite State Machines#Deep Research#Multi-hop QA#Adaptive Workflow#Memory Mechanism#Controllable AI2026년 1월 14일댓글 수 로딩 중
[논문리뷰] Controlled Self-Evolution for Algorithmic Code Optimization논문은 기존 LLM 기반 코드 생성 모델 이 기능적으로는 정확하지만 비효율적인 코드를 생성하며, 현재의 자가 진화(self-evolution) 방식이 낮은 탐색 효율성으로 인해 제한된 예산 내에서 최적의 알고리즘적 코드를 찾지 못하는 문제를 해결하고자 합니다.#Review#Self-Evolution#Code Optimization#Large Language Models#Genetic Algorithms#Hierarchical Memory#Algorithmic Code Generation#Exploration Efficiency2026년 1월 14일댓글 수 로딩 중
[논문리뷰] Dr. Zero: Self-Evolving Search Agents without Training Data본 논문은 기존 멀티턴 검색 에이전트의 데이터 없는 자기 진화 과정에서 발생하는 제한적인 질문 다양성과 다단계 추론 및 도구 사용에 필요한 막대한 컴퓨팅 자원 문제를 해결하는 것을 목표로 합니다.#Review#Self-Evolution#Search Agents#Large Language Models (LLMs)#Data-Free Learning#Reinforcement Learning (RL)#Hop-Grouped Relative Policy Optimization (HRPO)#Question Answering#Multi-hop Reasoning2026년 1월 12일댓글 수 로딩 중
[논문리뷰] Memory in the Age of AI Agents이 서베이 논문은 급증하는 AI 에이전트 메모리 연구 분야의 파편화된 개념적 명확성 부족을 해결하고, 기존 분류 체계의 한계 를 극복하고자 합니다.#Review#AI Agents#Memory Systems#LLMs#Taxonomy#Continual Learning#Self-Evolution#Multimodality#Reinforcement Learning2025년 12월 15일댓글 수 로딩 중
[논문리뷰] Fed-SE: Federated Self-Evolution for Privacy-Constrained Multi-Environment LLM Agents본 논문은 복잡한 인터랙티브 태스크에서 LLM 에이전트가 직면하는 프라이버시 제약으로 인해 중앙 집중식 최적화 및 동적 환경 간 공동 진화가 어려운 문제를 해결하고자 합니다.#Review#Federated Learning (FL)#LLM Agents#Self-Evolution#Privacy-Preserving#Multi-Environment#Parameter-Efficient Fine-Tuning#Low-Rank Aggregation#Reinforcement Learning2025년 12월 11일댓글 수 로딩 중
[논문리뷰] Live-SWE-agent: Can Software Engineering Agents Self-Evolve on the Fly?이 논문은 기존 LLM 기반 소프트웨어 에이전트가 고정된 설계와 값비싼 오프라인 훈련으로 인해 성능이 최적화되지 못하고 특정 벤치마크에 국한되는 한계를 해결하고자 합니다.#Review#Software Engineering Agents#LLM Agents#Self-Evolution#On-the-Fly Learning#Tool Creation#SWE-bench#Autonomous Systems#Code Generation2025년 11월 17일댓글 수 로딩 중
[논문리뷰] CoMAS: Co-Evolving Multi-Agent Systems via Interaction Rewards본 논문은 대규모 언어 모델(LLM) 기반 에이전트들이 외부 감독 없이 에이전트 간 상호작용 을 통해 자율적으로 능력을 개선하는 자체 진화(self-evolution) 패러다임을 확립하는 것을 목표로 합니다.#Review#Multi-Agent Systems#LLM Agents#Self-Evolution#Reinforcement Learning#Interaction Rewards#LLM-as-a-Judge#Decentralized Learning2025년 10월 10일댓글 수 로딩 중
[논문리뷰] Alignment Tipping Process: How Self-Evolution Pushes LLM Agents Off the Rails본 논문은 자기 진화(self-evolution) 능력을 가진 LLM 에이전트가 배포 후 시간이 지남에 따라 초기 정렬(alignment) 제약 조건을 포기하고 자기 이익을 추구하는 전략으로 전환하는 Alignment Tipping Process (ATP) 라는 새로운 위험 현상을 식별하고 분석합니다.#Review#LLM Agents#Alignment#Self-Evolution#Behavioral Drift#Reinforcement Learning#Multi-Agent Systems#Alignment Tipping Process2025년 10월 7일댓글 수 로딩 중