[논문리뷰] ACL-Verbatim: hallucination-free question answering for research본 논문은 현대적인 Retrieval-Augmented Generation (RAG) 시스템이 근본적으로 지니고 있는 환각(Hallucination) 및 답변의 불투명성 문제를 해결하고자 합니다. 기존 LLM 기반 RAG는 문서를 참조하더라도 모델 내부 지식과 혼합되어 부정확하거나 무의미한 답변을 생성할 위험이 큽니다.#Review#Retrieval-Augmented Generation#Hallucination-free#Extractive Question Answering#ModernBERT#ACL Anthology#Scientific QA2026년 6월 1일댓글 수 로딩 중
[논문리뷰] A Causal Language Modeling Detour Improves Encoder Continued Pretraining본 논문은 도메인 적응을 위한 인코더의 Continued Pretraining에서 기존의 MLM 단독 학습 방식이 갖는 한계를 극복하고자 합니다. 저자들은 특정 도메인(특히 Biomedical) 데이터에서 모델이 충분한 성능을 내지 못하는 이유가 학습 목적 함수 자체의 경직성 때문임을 지적합니다.#Review#Continued Pretraining#Causal Language Modeling#Masked Language Modeling#Domain Adaptation#Biomedical Encoders#CKA#Freeze Interventions#ModernBERT2026년 5월 12일댓글 수 로딩 중
[논문리뷰] Mecellem Models: Turkish Models Trained from Scratch and Continually Pre-trained for the Legal Domain본 논문은 터키어 법률 도메인에 특화된 언어 모델인 Mecellem 모델을 개발하여, 비영어권 및 전문 도메인(특히 터키어 법률)에서 대규모 언어 모델의 성능 저하 문제를 해결하는 것을 목표로 합니다. 이를 위해, 스크래치 학습된 인코더 모델과 지속적 사전 훈련(CPT)된 디코더 모델 두 가지 접근 방식을 제시합니다.#Review#Turkish Legal NLP#Domain Adaptation#ModernBERT#Continual Pre-training (CPT)#Embedding Models#Legal LLMs#Retrieval-Augmented Generation (RAG)#Curriculum Learning2026년 1월 25일댓글 수 로딩 중
[논문리뷰] Turk-LettuceDetect: A Hallucination Detection Models for Turkish RAG Applications대규모 언어 모델(LLMs)의 환각(hallucination) 문제를 해결하고, 특히 형태학적으로 복잡한 터키어 RAG(Retrieval-Augmented Generation) 애플리케이션 을 위한 효과적인 환각 탐지 모델을 개발하는 것이 목표입니다.#Review#Hallucination Detection#Retrieval Augmented Generation#Large Language Models#Turkish NLP#Token Classification#ModernBERT#Low-Resource Languages2025년 9월 23일댓글 수 로딩 중