#Chinese Context

1개의 포스트

[논문리뷰] LiveSecBench: A Dynamic and Culturally-Relevant AI Safety Benchmark for LLMs in Chinese Context

본 연구는 중국어 환경에서 대규모 언어 모델(LLMs)의 안전성 평가를 위한 동적(dynamic) 이며 문화적으로 적합한(culturally-relevant) 벤치마크인 LiveSecBench 를 제안하는 것을 목표로 합니다.

#Review #LLM Safety #AI Safety Benchmark #Chinese Context #Dynamic Evaluation #Cultural Relevance #Adversarial Robustness #ELO Rating System

2025년 11월 9일