#Alignment Data Extraction

1개의 포스트

[논문리뷰] Extracting alignment data in open models

본 논문은 오픈 모델에서 정렬(alignment) 훈련 데이터 를 효과적으로 추출하는 가능성을 탐구하고, 기존 문자열 매칭 기반의 메모리 추출 방식이 갖는 한계를 극복하는 것을 목표로 합니다.

#Review #Alignment Data Extraction #Large Language Models #Memorization #Neural Embeddings #Semantic Similarity #Chat Templates #Model Distillation #Reinforcement Learning #Supervised Finetuning

2025년 10월 22일