본문으로 건너뛰기

[논문리뷰] HAGE: Harnessing Agentic Memory via RL-Driven Weighted Graph Evolution

링크: 논문 PDF로 바로 열기

메타데이터

저자: Dongming Jiang, Yi Li, Guanpeng Li, Qiannan Li, Bingzhe Li, et al.


1. Key Terms & Definitions (핵심 용어 및 정의)

  • HAGE (Harnessing Agentic Memory via RL-Driven Weighted Graph Evolution): 에이전트의 기억을 다중 관계형 그래프로 구조화하고, 강화학습을 통해 쿼리 조건부 탐색(Query-Conditioned Traversal) 정책을 최적화하는 새로운 에이전트 메모리 프레임워크입니다.
  • Weighted Multi-Relational Memory Graph: 템포럴, 시맨틱, 인과관계, 엔티티 코레퍼런스 등 4가지 관계 유형을 포괄하며, 학습 가능한 에지 임베딩을 통해 관계의 강도와 쿼리 의존적 유용성을 표현하는 핵심 메모리 구조입니다.
  • QueryRouter: 쿼리의 의도와 에지 피처를 입력받아 탐색 과정에서 어떤 관계형 경로를 따라갈지 동적으로 결정하는 학습 가능한 MLP 기반 네트워크입니다.
  • Co-Evolutionary Training Dynamics: 에지 피처와 쿼리 라우팅 정책을 강화학습의 보상 신호를 기반으로 동시에 최적화하여, 메모리 구조와 접근 메커니즘이 함께 진화하도록 설계된 학습 체계입니다.

2. Motivation & Problem Statement (연구 배경 및 문제 정의)

본 논문은 기존의 에이전트 메모리 시스템이 정적인 검색(Static Lookup)이나 고정된 휴리스틱 그래프 탐색에 의존하여 장기 기억 활용의 효율성이 저하되는 문제를 해결하고자 합니다. 대부분의 기존 연구들은 메모리 내 관계를 단순한 연결성으로만 취급하며, 쿼리에 따라 관계의 중요도가 달라지는 Query-dependent relevance를 효과적으로 포착하지 못합니다. 또한, 고정된 그래프 확장 규칙은 불필요한 노이즈를 유발하거나 구조적으로 중요한 ‘bridge nodes’를 놓치는 등 long-horizon reasoning 성능에 병목을 발생시킵니다 [Figure 1]. 따라서 저자들은 메모리 접근을 고정된 절차가 아닌 최적화 가능한 순차적 결정 과정으로 재정의할 필요가 있다고 주장합니다.

Figure 1: MAG 아키텍처 개요

Figure 1 — MAG 아키텍처 개요

3. Method & Key Results (제안 방법론 및 핵심 결과)

본 논문은 HAGE 프레임워크를 통해 메모리 검색을 관계형 그래프 상의 쿼리 조건부 탐색으로 재설계합니다 [Figure 2]. 핵심 방법론은 두 가지로, 첫째는 각 에지에 학습 가능한 피처 벡터를 부여하여 쿼리 의도(Relation Intent)에 따른 구조적 가중치를 동적으로 변조하는 것이며, 둘째는 강화학습(REINFORCE)을 적용하여 하향식 작업 피드백으로 라우팅 정책과 에지 표현을 공동 최적화하는 것입니다. 이 과정에서 에지 피처의 불안정한 드리프트를 방지하기 위해 Anchor Regularization을 도입하여 초기 의미론적 구조를 보존합니다.

Figure 2: HAGE 아키텍처 상세

Figure 2 — HAGE 아키텍처 상세

실험 결과, HAGE는 장기 대화형 기억 벤치마크인 LoCoMo에서 gpt-4o-mini 백본 사용 시 평균 점수 0.739를 기록하여 기존 최상의 베이스라인인 MAGMA(0.700)를 유의미하게 상회했습니다. 또한 비대화형 멀티홉 QA 벤치마크인 HotpotQA에서도 F1 점수 0.678과 LLM Score 0.824를 달성하며 뛰어난 범용성을 입증했습니다. 특히, Adversarial 쿼리 유형에서 타 모델 대비 월등한 성능 향상을 보였으며, 이는 학습된 쿼리 적응형 탐색이 복잡한 추론 과정에서 노이즈를 억제하고 정교한 증거를 식별하는 데 효과적임을 시사합니다.

4. Conclusion & Impact (결론 및 시사점)

본 논문은 메모리 검색을 동적인 그래프 탐색 과정으로 모델링하고 이를 강화학습으로 최적화하는 HAGE 프레임워크를 제안하여 에이전트 기억 성능의 새로운 지평을 열었습니다. 이 연구는 고정된 휴리스틱 기반의 메모리 관리에서 벗어나, 에이전트가 직접 상황에 맞는 메모리 탐색 전략을 학습할 수 있음을 입증했다는 점에서 큰 학술적 의의를 갖습니다. 향후 본 연구는 복잡한 개인화 에이전트나 지식 집약적인 다중 세션 대화 시스템의 효율성과 정밀도를 향상시키는 핵심적인 기술적 기반이 될 것으로 기대됩니다.

⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.

댓글

관련 포스트

Review 의 다른글