[논문리뷰] M2Retinexformer: Multi-Modal Retinexformer for Low-Light Image Enhancement본 논문은 기존의 Retinex 기반 딥러닝 기법들이 RGB 정보에만 의존하여 장면의 기하학적 구조나 조명 분포를 효과적으로 해석하지 못한다는 한계를 해결하고자 합니다.#Review#Low-light Image Enhancement#Retinex Theory#Multi-modal Learning#Transformer#Cross-attention#Depth Estimation#Semantic Features2026년 5월 13일댓글 수 로딩 중
[논문리뷰] SE-DiCoW: Self-Enrolled Diarization-Conditioned Whisper본 논문은 Diarization-Conditioned Whisper (DiCoW)의 핵심 한계점인 STNO (Silence-Target-Non-target-Overlap) 마스크의 모호성 을 해결하고자 합니다.#Review#Target-Speaker ASR#DiCoW#Whisper Model#Multi-speaker ASR#Self-enrollment#Cross-attention#Speech Diarization2026년 1월 28일댓글 수 로딩 중
[논문리뷰] Cross-Attention is Half Explanation in Speech-to-Text Models본 논문은 S2T 모델에서 교차 어텐션(cross-attention) 점수가 입력-출력 의존성을 얼마나 잘 설명하는지 체계적으로 분석합니다.#Review#Cross-attention#Speech-to-Text (S2T)#Explainable AI (XAI)#Saliency Maps#Feature Attribution#Transformer#Context Mixing#Correlation2025년 9월 23일댓글 수 로딩 중