#Perplexity

5개의 포스트

[논문리뷰] DiPO: Disentangled Perplexity Policy Optimization for Fine-grained Exploration-Exploitation Trade-Off

arXiv에 게시된 'DiPO: Disentangled Perplexity Policy Optimization for Fine-grained Exploration-Exploitation Trade-Off' 논문에 대한 자세한 리뷰입니다.

#Review #Large Language Models #Reinforcement Learning #Exploration-Exploitation Trade-Off #Perplexity #Reward Shaping

2026년 4월 19일

[논문리뷰] On Surprising Effectiveness of Masking Updates in Adaptive Optimizers

arXiv에 게시된 'On Surprising Effectiveness of Masking Updates in Adaptive Optimizers' 논문에 대한 자세한 리뷰입니다.

#Review #Adaptive Optimizers #Gradient Masking #LLM Training #Geometric Regularization #Momentum Alignment #RMSProp #Perplexity #Deep Learning

2026년 2월 17일

[논문리뷰] On the Fallacy of Global Token Perplexity in Spoken Language Model Evaluation

Ju-Chieh Chou이 arXiv에 게시한 'On the Fallacy of Global Token Perplexity in Spoken Language Model Evaluation' 논문에 대한 자세한 리뷰입니다.

#Review #Spoken Language Models #Evaluation Metrics #Perplexity #Mean Opinion Score #Likelihood-based Evaluation #Model-as-a-Judge #Acoustic Consistency #Speech Generation

2026년 1월 12일

[논문리뷰] MemMamba: Rethinking Memory Patterns in State Space Model

Xiao Sun이 arXiv에 게시한 'MemMamba: Rethinking Memory Patterns in State Space Model' 논문에 대한 자세한 리뷰입니다.

#Review #State Space Models #Mamba #Long-sequence modeling #Memory decay #State summarization #Cross-layer attention #Perplexity #Linear complexity

2025년 10월 10일

[논문리뷰] TrustJudge: Inconsistencies of LLM-as-a-Judge and How to Alleviate Them

Zhuohao Yu이 arXiv에 게시한 'TrustJudge: Inconsistencies of LLM-as-a-Judge and How to Alleviate Them' 논문에 대한 자세한 리뷰입니다.

#Review #LLM-as-a-Judge #Evaluation Frameworks #Inconsistency Reduction #Probabilistic Scoring #Transitivity #Information Loss #Perplexity #Large Language Models

2025년 9월 26일