#Cultural Nuance

2개의 포스트

[논문리뷰] MEENA (PersianMMMU): Multimodal-Multilingual Educational Exams for N-level Assessment

본 논문은 영어 중심의 기존 VLM 벤치마크의 한계를 해결하고, 특히 페르시아어와 같은 저자원 언어에서 과학, 추론, 인간 수준의 이해 능력을 평가하기 위한 최초의 종합적인 멀티모달-멀티링구얼 벤치마크 를 제시하는 것을 목표로 합니다.

#Review #Multimodal Language Models #Multilingual Benchmarking #Persian Language #Educational Assessment #Vision-Language Models #Cultural Nuance #Reasoning Tasks

2025년 8월 26일

[논문리뷰] DITING: A Multi-Agent Evaluation Framework for Benchmarking Web Novel Translation

본 연구는 웹 소설 번역에 대한 기존 기계 번역(MT) 평가 벤치마크들이 표면적 지표에 의존하여 서사적 일관성, 문체적 충실도, 문화적 뉘앙스를 포착하지 못하는 한계를 해결하는 것을 목표로 합니다.

#Review #Machine Translation Evaluation #Large Language Models (LLMs)#Web Novel Translation #Multi-Agent Systems #Cultural Nuance #Benchmark Dataset #Natural Language Generation

2025년 10월 15일