#Multi-token Decoding

2개의 포스트

[논문리뷰] StepAudio 2.5 Technical Report

본 논문은 ASR, TTS, 실시간 음성 대화와 같은 서로 다른 음성 작업이 공통적인 표현 공간(Representational Space)을 공유함에도 불구하고, 기존 통합 모델들이 개별 특화 시스템 대비 성능 차이를 보이는 문제를 해결하고자 합니다.

#Review #Audio-Language Foundation #ASR #TTS #Realtime Interaction #RLHF #Multi-token Decoding #Operational Regimes

2026년 5월 24일

[논문리뷰] Direct Multi-Token Decoding

본 논문은 대규모 언어 모델(LLM)의 비효율적인 계층 활용을 해결하여 추론 속도를 가속화하는 것을 목표로 합니다.

#Review #LLM Inference #Multi-token Decoding #Transformer Architecture #Layer Specialization #Cyclical Refilling #Inference Speedup #Model Scaling

2025년 10월 16일