#Gradient Spectral Entropy

1개의 포스트

[논문리뷰] GradSentry: Gradient Spectral Entropy for Backdoor Sample Filtering in Large Language Model Fine-Tuning

본 논문은 LLM fine-tuning 과정에서 발생하는 backdoor 공격을 효과적으로 탐지하고 제거하기 위한 새로운 filtering 기법을 제안합니다.

#Review #LLM Fine-Tuning #Backdoor Defense #Gradient Spectral Entropy #Sample Filtering #SVD #Robustness

2026년 5월 27일