[논문리뷰] RAGEN-2: Reasoning Collapse in Agentic RL본 논문은 Mutual Information (MI) 기반의 진단 프레임워크와 SNR-Aware Filtering 기법을 제안한다. 연구진은 추론 품질을 Within-input diversity (Entropy)와 Cross-input distinguishability (MI)로 분해하여, 학습 과정에서 MI 프록시를 통해 템플릿 붕괴를 조기에 탐지한다 .#Review#Agentic RL#Reasoning Collapse#Mutual Information#Signal-to-Noise Ratio#Reward Variance#Template Collapse2026년 4월 8일댓글 수 로딩 중
[논문리뷰] Efficient RLVR Training via Weighted Mutual Information Data SelectionarXiv에 게시된 'Efficient RLVR Training via Weighted Mutual Information Data Selection' 논문에 대한 자세한 리뷰입니다.#Review#Reinforcement Learning#Data Selection#Mutual Information#Epistemic Uncertainty#LLMs#RLVR#Training Efficiency2026년 3월 2일댓글 수 로딩 중
[논문리뷰] An Information Theoretic Perspective on Agentic System DesignarXiv에 게시된 'An Information Theoretic Perspective on Agentic System Design' 논문에 대한 자세한 리뷰입니다.#Review#Agentic Systems#Language Models#Mutual Information#Rate-Distortion Theory#Compute Efficiency#Scaling Laws#Compressor-Predictor Architecture#On-device AI2025년 12월 29일댓글 수 로딩 중
[논문리뷰] MI-Fuse: Label Fusion for Unsupervised Domain Adaptation with Closed-Source Large-Audio Language ModelHung-yi Lee이 arXiv에 게시한 'MI-Fuse: Label Fusion for Unsupervised Domain Adaptation with Closed-Source Large-Audio Language Model' 논문에 대한 자세한 리뷰입니다.#Review#Speech Emotion Recognition#Source-Free Unsupervised Domain Adaptation#Large Audio-Language Models#Label Fusion#Mutual Information#API-Only Models#Domain Mismatch2025년 9월 26일댓글 수 로딩 중
[논문리뷰] REINA: Regularized Entropy Information-Based Loss for Efficient Simultaneous Speech TranslationXiao Yu이 arXiv에 게시한 'REINA: Regularized Entropy Information-Based Loss for Efficient Simultaneous Speech Translation' 논문에 대한 자세한 리뷰입니다.#Review#Simultaneous Speech Translation#Adaptive Policy#Entropy-based Loss#Mutual Information#Latency-Quality Trade-off#Speech-to-Text Translation#REINA2025년 8월 8일댓글 수 로딩 중