[논문리뷰] ThinkRouter: Efficient Reasoning via Routing Thinking between Latent and Discrete Spaces

2026년 2월 12일수정: 2026년 2월 12일

링크: 논문 PDF로 바로 열기

저자: Julian McAuley, Haoliang Wang, Xiang Chen, Tong Yu, Xin Xu

핵심 연구 목표

본 논문은 대규모 언어 모델(LLM)의 추론 효율성을 향상시키는 것을 목표로 합니다. 특히, 기존의 명시적 추론 궤적(CoT) 및 잠재 공간 추론 방식의 한계를 극복하고, 추론 정확도를 높이면서 생성 길이를 줄이는 새로운 방법을 제안합니다. 이는 모델의 추론 과정에서 발생하는 높은 자신감과 노이즈 문제를 해결하고자 합니다.

제안된 THINKROUTER 는 추론 시점에 작동하는 신뢰도 인식 라우팅 메커니즘 입니다. 각 추론 단계에서 모델의 최대 다음 토큰 확률(maximum next-token probability) 을 기준으로 신뢰도를 평가합니다. 신뢰도가 낮은 경우 (라우팅 임계값 $\tau$ 미만), 노이즈 유입을 방지하고 불확실성을 관리하기 위해 이산 토큰 공간(discrete token space) 으로 추론을 라우팅하여 단일 토큰을 샘플링합니다. 반대로 신뢰도가 높은 경우, Soft Thinking 에 기반한 확률 가중 소프트 임베딩(probability-weighted soft embedding) 을 계산하여 잠재 공간(latent space) 에서 추론을 진행합니다.

주요 결과

THINKROUTER 는 STEM 추론 및 코딩 벤치마크에서 기존 명시적 CoT , 무작위 라우팅 , 잠재 추론 대비 우수한 성능을 보였습니다. 평균적으로 Pass@1 정확도에서 19.70 포인트 향상을 달성했으며, 생성 길이는 최대 15.55% 감소했습니다. 특히, Soft Thinking 이 성능을 떨어뜨리는 경우에도 THINKROUTER 는 15.00 포인트 개선을 이루어냈다.

AI 실무자를 위한 시사점

THINKROUTER 는 추가 훈련 없이 추론 효율성을 크게 개선할 수 있는 실용적인 방법론을 제시합니다. 이는 LLM을 활용하는 추론 집약적인 애플리케이션에서 비용 및 지연 시간 을 줄이는 데 기여할 수 있습니다. 특히, 모델의 자신감 역학을 활용하여 잠재 공간 추론의 노이즈 문제를 완화하고, 명시적 CoT의 오류를 보정하는 능력은 실무자들이 LLM 기반 시스템의 신뢰성을 높이는 데 중요한 시사점을 제공합니다.

⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.

Review 의 다른글

이전글 [논문리뷰] Think Longer to Explore Deeper: Learn to Explore In-Context via Length-Incentivized Reinforcement Learning
현재글 : [논문리뷰] ThinkRouter: Efficient Reasoning via Routing Thinking between Latent and Discrete Spaces
다음글 [논문리뷰] Thinking with Drafting: Optical Decompression via Logical Reconstruction

[논문리뷰] ThinkRouter: Efficient Reasoning via Routing Thinking between Latent and Discrete Spaces

핵심 연구 목표

핵심 방법론

주요 결과

AI 실무자를 위한 시사점

댓글

관련 포스트

Review 의 다른글