[논문리뷰] Sparse Autoencoders as Plug-and-Play Firewalls for Adversarial Attack Detection in VLMs본 논문은 최신 Vision-Language Models(VLMs)가 Adversarial 공격에 극도로 취약하며, 기존의 탐지 방식들은 실질적인 배포 환경에서의 강력한 공격이나 데이터 분포 변화에 대응하지 못한다는 문제를 해결하고자 합니다.#Review#Vision-Language Models#Adversarial Attack Detection#Sparse Autoencoders#Plug-and-Play#Robustness#Out-of-Domain Generalization2026년 5월 10일댓글 수 로딩 중