[논문리뷰] Adapting Multilingual Embedding Models to Turkish via Cross-Lingual Tokenizer Surgery and Offline Distillation본 연구는 기존의 Multilingual Embedding Models가 Turkish와 같은 저자원(Low-resource) 언어에서 충분한 성능을 발휘하지 못하는 구조적 한계를 해결하고자 한다.#Review#Multilingual Embedding Models#Turkish#Tokenizer Surgery#Offline Distillation#Cross-Lingual Transfer#Semantic Search2026년 6월 1일댓글 수 로딩 중
[논문리뷰] Improving Semantic Proximity in Information Retrieval through Cross-Lingual Alignment본 논문은 기존의 CLIR 평가 방식이 실제 다국어 환경에서의 모델 성능과 잠재적인 언어 편향성을 충분히 측정하지 못한다는 문제를 지적한다.#Review#Cross-Lingual Information Retrieval#Semantic Alignment#Jensen-Shannon Divergence#InfoNCE#Multilingual Embedding Models#Language Bias2026년 4월 8일댓글 수 로딩 중