[논문리뷰] LatentSkill: From In-Context Textual Skills to In-Weight Latent Skills for LLM Agents

2026년 6월 8일수정: 2026년 6월 8일

링크: 논문 PDF로 바로 열기

메타데이터

저자: Aofan Yu, Chenyu Zhou, Tianyi Xu, Zihan Guo, Rong Shan, Zhihui Fu, Jun Wang, Weiwen Liu, Yong Yu, Weinan Zhang, Jianghao Lin

1. Key Terms & Definitions (핵심 용어 및 정의)

LatentSkill: 텍스트 형태의 기술(Textual Skills)을 Hypernetwork를 통해 LoRA adapter 가중치로 변환하여 모델 파라미터 내에 저장하는 프레임워크입니다.
Skill Compiler: 입력된 텍스트 기술을 분석하여 대응하는 LoRA 어댑터 파라미터를 생성하는 Hypernetwork 기반 모듈입니다.
In-Context Skill: 기존 방식과 같이 기술 정보를 프롬프트 내에 직접 주입하여 모델의 행동을 제어하는 방식입니다.
Component Merging: 기술을 여러 세부 컴포넌트로 분해하여 LoRA 파라미터 공간에서 정밀하게 결합함으로써, 성능 간섭을 최소화하고 기술을 복합적으로 사용하는 기법입니다.

2. Motivation & Problem Statement (연구 배경 및 문제 정의)

본 논문은 LLM Agent가 외부 기술을 프롬프트에 직접 주입할 때 발생하는 컨텍스트 오버헤드와 보안 노출 문제를 해결하고자 합니다. 기존의 In-Context Skill 방식은 매 단계마다 기술 텍스트를 삽입해야 하므로 추론 비용이 높고, 프롬프트 내에 기술 내용이 그대로 노출되어 공격에 취약하다는 단점이 있습니다. 또한, 에이전트 fine-tuning 방식은 기술을 모델 내부에 영구적으로 융합하여 모듈성(Modularity)을 저해합니다. 저자들은 기술 지식을 컨텍스트 공간이 아닌 Weight Space에 저장하여 효율적이고 안전하며 조립 가능한 에이전트 시스템을 구축하는 새로운 접근 방식을 제안합니다 [Figure 1].

Figure 1: LatentSkill의 핵심 장점

Figure 1 — LatentSkill의 핵심 장점

3. Method & Key Results (제안 방법론 및 핵심 결과)

본 논문은 Hypernetwork를 활용하여 텍스트 기술을 Plug-and-play 가능한 LoRA 어댑터로 변환하는 LatentSkill 프레임워크를 제안합니다 [Figure 2]. 제안 방법론은 크게 기술 문서 사전 학습(Pretraining), 에이전트 궤적을 활용한 지도 미세 조정(Trajectory-SFT), 그리고 추론 단계에서의 제어 가능한 기술 조합 단계로 구성됩니다. 주요 실험 결과로, ALFWorld와 Search-QA 벤치마크에서 기존 In-Context Skill 대비 월등한 성능 우위를 입증했습니다. 특히, ALFWorld의 경우 seen/unseen split에서 각각 21.4점, 13.4점의 성공률 향상을 보였으며, Prefill 토큰 오버헤드를 64.1% 감소시켰습니다 [Table 1]. Search-QA에서도 평균 Exact Match 점수가 3.0점 향상되었고, 기술 토큰 오버헤드를 72.2% 절감했습니다 [Table 2]. 추가 분석을 통해 생성된 LoRA 가중치가 의미론적 구조(Semantic Geometry)를 형성하고, LoRA scaling coefficient(α)를 통해 정밀하게 제어 가능하며, 컴포넌트 단위의 Parameter-space Arithmetic을 통해 효율적인 기술 조합이 가능함을 확인했습니다 [Figure 3, Figure 4].

Figure 2: LatentSkill 전체 구조

Figure 2 — LatentSkill 전체 구조

4. Conclusion & Impact (결론 및 시사점)

본 연구는 기술 지식을 Weight Space로 성공적으로 내재화함으로써, 에이전트의 효율성과 보안성을 동시에 확보하는 새로운 패러다임을 제시했습니다. LatentSkill을 통해 모델의 Context Window 사용량을 획기적으로 줄이면서도 에이전트의 확장성과 모듈성을 보존할 수 있음을 입증했습니다. 이는 향후 대규모 에이전트 시스템이 복잡한 작업을 수행할 때 기술의 라이브러리화와 즉각적인 조합을 가능하게 하여, 실무적인 에이전트 개발 환경에 큰 기여를 할 것으로 기대됩니다.

Figure 4: Injection 강도 α 제어 곡선

Figure 4 — Injection 강도 α 제어 곡선

⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.

Review 의 다른글

이전글 [논문리뷰] Latent Spatial Memory for Video World Models
현재글 : [논문리뷰] LatentSkill: From In-Context Textual Skills to In-Weight Latent Skills for LLM Agents
다음글 [논문리뷰] Lean4Agent: Formal Modeling and Verification for Agent Workflow and Trajectory