[논문리뷰] NanoKnow: How to Know What Your Language Model Knows본 연구는 대규모 언어 모델(LLMs)이 지식을 어떻게 획득하고 활용하는지에 대한 근본적인 질문에 답하고자 합니다. 특히, LLM의 사전 훈련 데이터가 종종 '블랙 박스'로 남아있어 지식의 출처를 추적하기 어렵다는 문제를 해결하고, 파라미터 내 지식과 외부 지식의 상호작용을 명확히 이해하는 것을 목표로 합니다.#Review#LLM Knowledge#Pre-training Data#Retrieval-Augmented Generation (RAG)#FineWeb-Edu#nanochat#Benchmarking#Question Answering#Data Attribution2026년 2월 25일댓글 수 로딩 중
[논문리뷰] QuCo-RAG: Quantifying Uncertainty from the Pre-training Corpus for Dynamic Retrieval-Augmented Generation대규모 언어 모델(LLM)의 내부 신호(예: logits, 엔트로피)가 부정확한 예측에 대해 종종 높은 확신을 보이는 등 신뢰할 수 없다는 문제점을 해결하고자 합니다.#Review#Dynamic RAG#Hallucination Detection#Corpus Statistics#Uncertainty Quantification#Pre-training Data#LLM Calibration#Infini-gram#Multi-hop QA2025년 12월 22일댓글 수 로딩 중