[논문리뷰] RelayGen: Intra-Generation Model Switching for Efficient ReasoningarXiv에 게시된 'RelayGen: Intra-Generation Model Switching for Efficient Reasoning' 논문에 대한 자세한 리뷰입니다.#Review#LLM Inference Optimization#Model Switching#Efficient Reasoning#Speculative Decoding#Runtime Adaptation#Discourse-Level Cues#Latency Reduction2026년 2월 9일댓글 수 로딩 중