#Evolutionary Optimization

3개의 포스트

[논문리뷰] HarnessX: A Composable, Adaptive, and Evolvable Agent Harness Foundry

본 논문은 현대 AI Agent의 성능이 모델 자체의 스케일링뿐만 아니라 이를 둘러싼 Harness 설계에 크게 의존함에도 불구하고, 기존 Harness들이 수동적이고 정적(static)이라는 점을 핵심 문제로 정의합니다.

#Review #AI Agent #Harness Engineering #Evolutionary Optimization #Agentic Workflow #Composable Architecture #Operational Mirror #GRPO

2026년 6월 14일

[논문리뷰] Darwin Family: MRI-Trust-Weighted Evolutionary Merging for Training-Free Scaling of Language-Model Reasoning

본 논문은 대규모 LLM의 추론 성능 향상을 위한 고비용의 post-training(instruction tuning, RL 등) 과정을 배제하고, 기존 Checkpoint 내에 잠재된 능력을 재조합하는 비용 효율적인 대안을 제시합니다.

#Review #Model Merging #Evolutionary Optimization #Large Language Models #Reasoning #Diagnostic-Guided #Training-Free

2026년 5월 14일

[논문리뷰] Learning to Learn-at-Test-Time: Language Agents with Learnable Adaptation Policies

본 논문은 LLM 기반 에이전트가 새로운 환경에서 적응하지 못하고 에피소드마다 동일한 오류를 반복하는 한계를 해결하고자 한다. 기존의 TTL 방식은 주로 고정된, 사람이 직접 설계한(hand-crafted) 휴리스틱에 의존하며, 이는 에이전트의 실질적인 학습 능력을 충분히 이끌어내지 못한다.

#Review #Test-Time Learning #Language Agents #Meta-Learning #Evolutionary Optimization #Adaptive Policy #LLM Agents #Prompt Engineering

2026년 4월 6일