#ModernBERT

4개의 포스트

[논문리뷰] ACL-Verbatim: hallucination-free question answering for research

본 논문은 현대적인 Retrieval-Augmented Generation (RAG) 시스템이 근본적으로 지니고 있는 환각(Hallucination) 및 답변의 불투명성 문제를 해결하고자 합니다. 기존 LLM 기반 RAG는 문서를 참조하더라도 모델 내부 지식과 혼합되어 부정확하거나 무의미한 답변을 생성할 위험이 큽니다.

#Review #Retrieval-Augmented Generation #Hallucination-free #Extractive Question Answering #ModernBERT #ACL Anthology #Scientific QA

2026년 6월 1일

[논문리뷰] A Causal Language Modeling Detour Improves Encoder Continued Pretraining

본 논문은 도메인 적응을 위한 인코더의 Continued Pretraining에서 기존의 MLM 단독 학습 방식이 갖는 한계를 극복하고자 합니다. 저자들은 특정 도메인(특히 Biomedical) 데이터에서 모델이 충분한 성능을 내지 못하는 이유가 학습 목적 함수 자체의 경직성 때문임을 지적합니다.

#Review #Continued Pretraining #Causal Language Modeling #Masked Language Modeling #Domain Adaptation #Biomedical Encoders #CKA #Freeze Interventions #ModernBERT

2026년 5월 12일

[논문리뷰] Mecellem Models: Turkish Models Trained from Scratch and Continually Pre-trained for the Legal Domain

본 논문은 터키어 법률 도메인에 특화된 언어 모델인 Mecellem 모델을 개발하여, 비영어권 및 전문 도메인(특히 터키어 법률)에서 대규모 언어 모델의 성능 저하 문제를 해결하는 것을 목표로 합니다. 이를 위해, 스크래치 학습된 인코더 모델과 지속적 사전 훈련(CPT)된 디코더 모델 두 가지 접근 방식을 제시합니다.

#Review #Turkish Legal NLP #Domain Adaptation #ModernBERT #Continual Pre-training (CPT)#Embedding Models #Legal LLMs #Retrieval-Augmented Generation (RAG)#Curriculum Learning

2026년 1월 25일

[논문리뷰] Turk-LettuceDetect: A Hallucination Detection Models for Turkish RAG Applications

대규모 언어 모델(LLMs)의 환각(hallucination) 문제를 해결하고, 특히 형태학적으로 복잡한 터키어 RAG(Retrieval-Augmented Generation) 애플리케이션 을 위한 효과적인 환각 탐지 모델을 개발하는 것이 목표입니다.

#Review #Hallucination Detection #Retrieval Augmented Generation #Large Language Models #Turkish NLP #Token Classification #ModernBERT #Low-Resource Languages

2025년 9월 23일