[논문리뷰] A Survey of Large Audio Language Models: Generalization, Trustworthiness, and Outlook본 논문은 LALMs 분야의 급격한 발전에도 불구하고, 모델의 성능 평가 기준과 범용적 활용에 대한 통합적인 체계가 부족하다는 점을 해결하고자 한다.#Review#Large Audio Language Models#Audio-Language Pretraining#Multimodal Foundation Models#Audio Reasoning#Model Alignment#Generalization#Trustworthiness2026년 5월 20일댓글 수 로딩 중
[논문리뷰] Step-Audio-R1 Technical Report오디오 언어 모델이 추론 과정을 거치면 성능이 저하되는 기존의 문제, 즉 '텍스트 대리 추론' 현상을 해결하고, 오디오 도메인에서 진정한 추론 능력을 성공적으로 활성화하는 것을 목표로 합니다. 이는 오디오 인텔리전스에 대한 심층적 사고의 이점을 입증하고자 합니다.#Review#Audio Reasoning#Multimodal LLMs#Modality-Grounded Reasoning Distillation (MGRD)#Chain-of-Thought#Reinforcement Learning#Audio Understanding#Self-Distillation2025년 11월 20일댓글 수 로딩 중