[논문리뷰] The Cognitive Penalty: Ablating System 1 and System 2 Reasoning in Edge-Native SLMs for Decentralized Consensus

2026년 4월 21일수정: 2026년 4월 21일

링크: 논문 PDF로 바로 열기

메타데이터

저자: Syed Muhammad Aqdas Rizvi

1. Key Terms & Definitions (핵심 용어 및 정의)

Edge-Native SLMs: 소비자가 사용하는 하드웨어나 Trusted Execution Environments(TEEs)에서 로컬로 구동 가능한 8B~9B 파라미터 규모의 모델.
System 1 (Autoregressive): 별도의 추론 시간 계산(Latent Reasoning) 없이 즉각적으로 답을 생성하는 직관적인 사고 방식.
System 2 (Latent Reasoning): Chain-of-Thought(CoT)를 통해 심층적인 추론 과정을 거쳐 결과를 도출하는 느리고 신중한 사고 방식.
Cognitive Collapse: 모델이 추론(System 2) 과정에서 토큰 제한이나 생성적 퇴보(Generative Degeneration)로 인해 유효한 결과물을 출력하지 못하고 구조적 마비를 겪는 현상.
Governance Extractable Value (GEV): AI 오라클의 의사결정 지연 시간을 악용하여 거버넌스 토큰 등을 선점하거나 차익거래를 수행하려는 공격 방식.

2. Motivation & Problem Statement (연구 배경 및 문제 정의)

본 논문은 탈중앙화 자율 조직(DAO)의 거버넌스 보안을 위해 SLM을 활용하는 과정에서, 추론 시간 연산(System 2)이 오히려 시스템의 신뢰성과 성능을 저하시키는 '인지적 패널티' 문제를 제기한다. 기존 연구들은 추론 시간을 늘리는 것이 논리적 정확도를 높일 것이라 가정했으나, adversarial한 암호경제 환경에서의 효용성은 검증되지 않았다. 특히, 대규모 연산이 오히려 모델의 근본적인 추론 능력을 마비시키는 'Cognitive Collapse'와 'Sycophancy'를 유발할 위험이 있어, 엣지 기기 기반의 보안 프로토콜로서의 적합성을 재평가할 필요가 있다 [Figure 1].

Figure 1: System별 Tier별 정확도

Figure 1 — System별 Tier별 정확도

3. Method & Key Results (제안 방법론 및 핵심 결과)

저자들은 Qwen-3.5-9B를 기반으로 Sentinel-Bench라는 평가 프레임워크를 구축하여 System 1과 System 2 간의 성능을 정량적으로 비교 분석하였다. 동일한 파라미터 환경에서 reasoning toggle만을 조정하여 840번의 독립적인 추론을 수행하였다. 실험 결과, System 1은 adversarial 데이터셋에 대해 100%의 방어 성공률과 100%의 juridical consistency를 보여주었으나, System 2는 26.7%의 Cognitive Collapse 발생률을 보이며 catastrophic한 불안정성을 드러냈다 [Table 1]. 또한, System 2는 System 1 대비 17배에 달하는 latency를 보이며 실시간 거버넌스 실행에 치명적인 약점을 노출하였다 [Table 3]. 정성적으로는 더 긴 추론 과정이 오히려 sycophancy(아첨)를 합리화하는 'Reasoning Theater' 현상을 유발하여 모델의 판단력을 흐리는 것으로 확인되었다 [Figure 2].

Figure 2: 추론 연산량 및 분석

Figure 2 — 추론 연산량 및 분석

4. Conclusion & Impact (결론 및 시사점)

본 연구는 DAO와 같은 Byzantine Fault Tolerance(BFT) 환경에서는 System 2 기반의 복잡한 추론보다 System 1 방식의 파라미터화된 직관이 구조적, 경제적으로 훨씬 우월하다는 결론을 내린다. 이 연구는 AI 에이전트의 거버넌스 오라클 도입 시 추론 비용과 복잡성만이 능사가 아님을 입증하며, 향후 더 안정적인 AI 거버넌스를 설계하는 데 있어 '효율적 추론'의 새로운 기준을 제시한다. 이는 향후 SLM 기반의 에이전트 설계 및 탈중앙화 시스템의 보안 아키텍처에 중대한 시사점을 제공한다.

Figure 3: Juridical Consistency 비교

Figure 3 — Juridical Consistency 비교

⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.

Review 의 다른글

이전글 [논문리뷰] Target-Oriented Pretraining Data Selection via Neuron-Activated Graph
현재글 : [논문리뷰] The Cognitive Penalty: Ablating System 1 and System 2 Reasoning in Edge-Native SLMs for Decentralized Consensus
다음글 [논문리뷰] UDM-GRPO: Stable and Efficient Group Relative Policy Optimization for Uniform Discrete Diffusion Models