#Attention Sinks

3개의 포스트

[논문리뷰] Mitigating Attention Sinks and Massive Activations in Audio-Visual Speech Recognition with LLMS

arXiv에 게시된 'Mitigating Attention Sinks and Massive Activations in Audio-Visual Speech Recognition with LLMS' 논문에 대한 자세한 리뷰입니다.

#Review #Audio-Visual Speech Recognition #Large Language Models #Attention Sinks #Massive Activations #Decorrelation Loss #Fine-tuning #Multimodal AI

2025년 10월 28일

[논문리뷰] Attention Sinks in Diffusion Language Models

Simone Scardapane이 arXiv에 게시한 'Attention Sinks in Diffusion Language Models' 논문에 대한 자세한 리뷰입니다.

#Review #Diffusion Language Models #Attention Sinks #Transformer Architecture #Masked Language Modeling #Bidirectional Attention #Generative Models #Robustness #Dynamic Attention

2025년 10월 23일

[논문리뷰] RefAM: Attention Magnets for Zero-Shot Referral Segmentation

Federico Tombari이 arXiv에 게시한 'RefAM: Attention Magnets for Zero-Shot Referral Segmentation' 논문에 대한 자세한 리뷰입니다.

#Review #Zero-Shot Segmentation #Referring Segmentation #Diffusion Transformers (DiTs)#Attention Mechanisms #Attention Sinks #Stop Words #Vision-Language Models #Training-Free Methods

2025년 9월 29일