[논문리뷰] LiteStage: Latency-aware Layer Skipping for Multi-stage Reasoning본 연구는 소규모 LLM에서 다단계 추론 시 발생하는 높은 레이턴시 문제를 해결하고자 합니다.#Review#Layer Skipping#Multi-stage Reasoning#Latency Optimization#Early Exit#Small Language Models (LLMs)#Adaptive Computation#Confidence-based Decoding2025년 10월 17일댓글 수 로딩 중