[논문리뷰] SE-DiCoW: Self-Enrolled Diarization-Conditioned Whisper본 논문은 Diarization-Conditioned Whisper (DiCoW)의 핵심 한계점인 STNO (Silence-Target-Non-target-Overlap) 마스크의 모호성 을 해결하고자 합니다.#Review#Target-Speaker ASR#DiCoW#Whisper Model#Multi-speaker ASR#Self-enrollment#Cross-attention#Speech Diarization2026년 1월 28일댓글 수 로딩 중
[논문리뷰] End-to-End Joint ASR and Speaker Role Diarization with Child-Adult Interactions본 논문은 아동-성인 상호작용에서 정확한 전사 및 화자 역할 분리(speaker role diarization)의 어려움을 해결하는 것을 목표로 합니다.#Review#End-to-End ASR#Speaker Diarization#Child Speech Processing#Whisper Model#Serialized Output Training#Multi-task Learning#State-Machine Decoding2026년 1월 26일댓글 수 로딩 중