[논문리뷰] ClawKeeper: Comprehensive Safety Protection for OpenClaw Agents Through Skills, Plugins, and Watchers
링크: 논문 PDF로 바로 열기
저자: Songyang Liu, Chaozhuo Li, Chenxu Wang, Jinyu Hou, Zejian Chen, Litian Zhang, Zheng Liu, Qiwei Ye, Yiming Hei, Xi Zhang, Zhongyuan Wang
1. Key Terms & Definitions (핵심 용어 및 정의)
- OpenClaw : 도구 통합, 로컬 파일 접근 및 셸 명령 실행 능력을 갖춘 오픈 소스 자율 에이전트 런타임 플랫폼입니다.
- Watcher : Task-executing agent와 분리되어 독립적으로 동작하며, 실시간 세션 모니터링과 행동 검증을 수행하는 보안 미들웨어 에이전트입니다.
- Skill-based Protection : 에이전트의 인스트럭션 레벨에서 구조화된 보안 정책을 컨텍스트에 주입하여 환경별 제약 조건을 강제하는 기법입니다.
- Plugin-based Protection : 런타임 내부에서 하드 코딩된 보호 계층을 구축하여 위협 탐지, 모니터링, 그리고 환경 구성 강화(Configuration Hardening)를 수행하는 방식입니다.
- Defense Success Rate (DSR) : 특정 보안 위협 카테고리에서 에이전트가 공격을 성공적으로 차단하고 기능적 무결성을 유지한 비율을 측정하는 성능 지표입니다.
2. Motivation & Problem Statement (연구 배경 및 문제 정의)
본 논문은 OpenClaw와 같은 현대 자율 에이전트 런타임이 가지는 높은 권한 모델로 인해 발생하는 시스템 수준의 보안 취약점을 해결하기 위해 제안되었습니다. 기존의 보안 조치들은 에이전트 수명 주기 중 특정 단계에만 국한되거나, 보안과 에이전트 성능 간의 Safety-Utility Tradeoff 문제를 해결하지 못하는 파편화된(Fragmented) 형태를 띠고 있습니다. 특히, 기존의 사후 대응(Reactive) 방식이나 정적(Static) 규칙 기반의 방어 체계는 에이전트의 능동적인 진화와 변화하는 위협 환경에 유연하게 대응하지 못합니다. 따라서 보안 로직을 에이전트 핵심 로직과 분리하고, 실시간으로 위협을 식별 및 차단할 수 있는 다층적이고 독립적인 보안 프레임워크가 필수적입니다.

은 이러한 통합적 보호를 제공하기 위한 ClawKeeper의 아키텍처를 보여줍니다.
3. Method & Key Results (제안 방법론 및 핵심 결과)
본 논문은 Skill, Plugin, 그리고 외부 Watcher라는 세 가지 보완적 계층을 통해 포괄적인 보안을 제공하는 ClawKeeper 프레임워크를 제안합니다. [Figure 1]에서 제시된 바와 같이, Skill-based 계층은 instruction 단계에서 제약을 강제하고, Plugin-based 계층은 런타임 수준의 감시와 hardening을 수행하며, Watcher 계층은 독립적인 모니터링을 통해 시스템 수준의 중재를 담당합니다. 특히 Watcher는 Task-executing agent로부터의 regulatory separation을 통해 보안 로직이 임의로 비활성화되는 것을 방지합니다.

의 실험 결과에 따르면, ClawKeeper 는 프롬프트 주입, 데이터 유출, 권한 상승 등 7가지 핵심 보안 위협 카테고리에서 기존 baseline 대비 15~45%p 높은 DSR 을 기록하며 압도적인 성능을 증명했습니다. 또한,

에서 볼 수 있듯이 Watcher는 새로운 위협 사례를 처리할수록 실시간으로 학습하여 DSR 을 약 90%에서 95%까지 향상시키는 자가 진화(Self-evolving) 능력을 입증하였습니다.
4. Conclusion & Impact (결론 및 시사점)
본 연구는 OpenClaw 생태계를 위한 통합 보안 프레임워크로서 ClawKeeper 를 제시하며, 에이전트가 운영체제와 유사한 역할을 수행함에 따라 필수적인 안티바이러스 소프트웨어로서의 가치를 강조합니다. 독립적인 Watcher 아키텍처는 Task-safety coupling 문제를 효과적으로 해소하며, 시스템의 복잡성과 무관하게 범용적으로 적용 가능한 보안 패러다임을 확립하였습니다. 이 연구는 미래의 에이전트 기반 컴퓨팅 시스템에서 보안 설계의 핵심적인 참조 모델로 활용될 것이며, 학계와 산업계 전반에 걸쳐 자율 에이전트의 안전한 배포를 위한 새로운 표준을 제공합니다.
⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.
관련 포스트
- [논문리뷰] StreamingClaw Technical Report
- [논문리뷰] Frontier AI Risk Management Framework in Practice: A Risk Analysis Technical Report v1.5
- [논문리뷰] AgentLongBench: A Controllable Long Benchmark For Long-Contexts Agents via Environment Rollouts
- [논문리뷰] Advances and Frontiers of LLM-based Issue Resolution in Software Engineering: A Comprehensive Survey
- [논문리뷰] Beyond Static Tools: Test-Time Tool Evolution for Scientific Reasoning
Review 의 다른글
- 이전글 [논문리뷰] Benchmarking and Mechanistic Analysis of Vision-Language Models for Cross-Depiction Assembly Instruction Alignment
- 현재글 : [논문리뷰] ClawKeeper: Comprehensive Safety Protection for OpenClaw Agents Through Skills, Plugins, and Watchers
- 다음글 [논문리뷰] Embarrassingly Simple Self-Distillation Improves Code Generation
댓글