[논문리뷰] Efficient and Scalable Provenance Tracking for LLM-Generated Code Snippets본 논문은 LLM이 생성한 코드의 출처를 투명하게 추적하고 저작권 준수를 확인해야 하는 시급한 문제 의식에서 출발합니다. 기존의 Winnowing 기반 플래지어리즘 탐지 도구는 정확도는 높지만, 데이터셋 전체를 스캔해야 하는 선형 시간 복잡도로 인해 최신 LLM이 학습되는 대규모 데이터셋에 적용하기에는 한계가 있습니다.#Review#Provenance Tracking#Code Similarity#LLM#Vector Search#Winnowing#SourceTracker#HybridSourceTracker2026년 5월 27일댓글 수 로딩 중