#Accuracy Improvement

2개의 포스트

[논문리뷰] Dr.LLM: Dynamic Layer Routing in LLMs

대규모 언어 모델(LLM)이 모든 입력 토큰을 고정된 모든 레이어에 통과시키면서 발생하는 비효율성(쉬운 작업 시 연산 낭비)과 복잡한 추론 작업 시 유연성 부족 문제를 해결하는 것을 목표로 합니다.

#Review #Dynamic Routing #LLMs #Adaptive Depth #Computational Efficiency #Monte Carlo Tree Search (MCTS)#Retrofittable Framework #Supervised Learning #Accuracy Improvement

2025년 10월 15일

[논문리뷰] SwiReasoning: Switch-Thinking in Latent and Explicit for Pareto-Superior Reasoning LLMs

본 연구는 훈련 없이 잠재 공간 추론을 사용하는 대규모 언어 모델(LLMs)이 겪는 두 가지 주요 문제점을 해결하고자 합니다.

#Review #LLM Reasoning #Latent Thinking #Explicit Thinking #Training-Free #Token Efficiency #Accuracy Improvement #Dynamic Switching #Entropy-based Control

2025년 10월 7일