[논문리뷰] When Cloud Agents Meet Device Agents: Lessons from Hybrid Multi-Agent Systems

2026년 5월 28일수정: 2026년 5월 28일

링크: 논문 PDF로 바로 열기

메타데이터

저자: Corrado Rainone, Davide Belli, Bence Major, Arash Behboodi

## 1. Key Terms & Definitions (핵심 용어 및 정의)

PEVR (Plan-Execute-Verify-Replan): 클라우드 기반 Supervisor가 초기 계획을 수립하고, 에지 장치의 Executor가 이를 수행하며, 주기적으로 계획을 검증하고 필요한 경우 재계획하는 MAS 아키텍처.
EVA (Execute-Verify-Advise): 에지 장치의 Executor가 직접 작업을 수행하고, 클라우드 기반 Supervisor가 주기적으로 진행 상황을 요약 및 조언하여 교정하는 MAS 아키텍처.
KV-cache: LLM이 추론 과정에서 이전 토큰의 키와 값 상태를 저장하여 중복 연산을 줄이는 메모리 캐시로, 에지 장치의 제한된 DRAM에서 상한선을 결정하는 핵심 요소.
Pareto frontier: 특정 작업 도메인에서 정확도(Accuracy), 비용(Cost), 에너지 소비(Energy Consumption) 간의 최적 균형점을 나타내는 성능 경계선.

## 2. Motivation & Problem Statement (연구 배경 및 문제 정의) 본 연구는 클라우드 기반의 고성능 Frontier 모델과 에지 장치 기반의 고효율 SLM(Small Language Model)을 통합하는 하이브리드 Multi-Agent System(MAS)의 설계 공간을 체계적으로 탐구합니다. Frontier 모델은 높은 API 비용과 토큰 소비라는 경제적 한계를 가지며, SLM은 장치의 제한된 DRAM으로 인해 긴 context length 처리에 제약이 있습니다. 이러한 상충 관계를 해결하기 위한 일반적인 설계 원칙이 부재하며, 기존 연구들은 특정 도메인에 치우친 ad hoc 방식의 접근을 취하고 있습니다. 저자들은 에지-클라우드 간의 협업을 통해 성능, 비용, 에너지 효율 사이의 Pareto frontier를 개선하고자 합니다.

## 3. Method & Key Results (제안 방법론 및 핵심 결과) 저자들은 클라우드-에지 하이브리드 추론을 지원하기 위해 PEVR과 EVA라는 두 가지 대표적인 MAS 아키텍처를 적응(Adapt) 및 연구하였습니다. PEVR은 계획 기반의 엄격한 중앙 집중식 제어를 수행하며, EVA는 작업 요약 및 사후 조언을 통한 유연한 제어 방식을 취합니다. 실험 결과, 하이브리드 MAS는 단일 에지 모델보다 우수한 성능을 보이면서도 클라우드 전용 모델 대비 비용을 절감하는 것으로 나타났습니다. 특히 AppWorld와 같은 UI 지원 작업에서는 PEVR이, FanOutQA나 HotpotQA와 같은 Deep Search 작업에서는 EVA가 더 우수한 성능을 보여, 도메인에 따른 최적 아키텍처가 존재함을 입증하였습니다. 또한, 두 아키텍처 모두 에지 장치에서 context reset 및 요약 기법을 활용하여 모놀리식 에지 모델 대비 KV-cache 증가를 억제하고 에너지 소비를 최대 3배까지 절감하는 성과를 거두었습니다 [Figure 2].

Figure 2: 다양한 작업 환경에서 비용 및 에너지 소비 대비 성능을 보여주는 핵심 실험 데이터

Figure 2 — 다양한 작업 환경에서 비용 및 에너지 소비 대비 성능을 보여주는 핵심 실험 데이터

## 4. Conclusion & Impact (결론 및 시사점) 최적의 하이브리드 MAS 구성은 단일한 형태가 아니라 작업 도메인과 제약 사항에 따라 결정되는 task-dependent한 특성을 가집니다. 본 연구는 클라우드와 에지 모델 간의 전략적 협업이 에지 장치의 하드웨어 제약을 극복하고 효율성을 극대화할 수 있음을 입증하였습니다. 이러한 결과는 향후 에지 컴퓨팅 기반의 에이전트 설계 시 더 낮은 전력 소비와 낮은 비용으로 고성능을 달성하려는 산업계와 학계의 연구에 실질적인 지침을 제공합니다. 특히, 고정된 모델보다 적응형 라우팅 및 계층적 하이브리드 설계를 지향하는 차세대 에이전트 시스템 구축에 중요한 시사점을 줍니다.

Figure 1: 제안하는 두 가지 핵심 MAS 아키텍처인 PEVR과 EVA의 시스템 흐름을 명확히 보여주는 다이어그램

Figure 1 — 제안하는 두 가지 핵심 MAS 아키텍처인 PEVR과 EVA의 시스템 흐름을 명확히 보여주는 다이어그램

⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.

Review 의 다른글

이전글 [논문리뷰] Verifiable Rewards Beyond Math and Code: Lightweight Corpus-Grounded Process Supervision for Factual Question Answering
현재글 : [논문리뷰] When Cloud Agents Meet Device Agents: Lessons from Hybrid Multi-Agent Systems
다음글 [논문리뷰] When Should Models Change Their Minds? Contextual Belief Management in Large Language Models

[논문리뷰] When Cloud Agents Meet Device Agents: Lessons from Hybrid Multi-Agent Systems

메타데이터

댓글

관련 포스트

Review 의 다른글