#Accuracy-Efficiency Trade-off

2개의 포스트

[논문리뷰] Drax: Speech Recognition with Discrete Flow Matching

자동 음성 인식(ASR) 분야에서 순차적 디코딩 방식의 자기회귀(AR) 모델 이 가진 효율성 병목 현상과 높은 지연 시간을 해결하는 것이 주요 목표입니다.

#Review #Automatic Speech Recognition (ASR)#Discrete Flow Matching (DFM)#Non-Autoregressive (NAR)#Generative Models #Tri-mixture Probability Path #Parallel Decoding #Accuracy-Efficiency Trade-off #Speech Synthesis

2025년 10월 8일

[논문리뷰] DLER: Doing Length pEnalty Right - Incentivizing More Intelligence per Token via Reinforcement Learning

본 논문은 추론 언어 모델(LLM)이 불필요하게 긴 출력을 생성하는 문제를 해결하고, 토큰당 인텔리전스(정확도 대비 응답 길이)를 극대화하는 것을 목표로 합니다. 특히, 길이 패널티로 인한 정확도 저하가 패널티 설계 자체보다는 RL 최적화 기법 의 미흡함에서 비롯됨을 재조명하여 이를 개선하고자 합니다.

#Review #Reinforcement Learning #Length Penalty #Reasoning Efficiency #Large Language Models #RL Optimization #Accuracy-Efficiency Trade-off #Chain-of-Thought

2025년 10월 20일