[논문리뷰] GradSentry: Gradient Spectral Entropy for Backdoor Sample Filtering in Large Language Model Fine-Tuning본 논문은 LLM fine-tuning 과정에서 발생하는 backdoor 공격을 효과적으로 탐지하고 제거하기 위한 새로운 filtering 기법을 제안합니다.#Review#LLM Fine-Tuning#Backdoor Defense#Gradient Spectral Entropy#Sample Filtering#SVD#Robustness2026년 5월 27일댓글 수 로딩 중