#CTI Reasoning

1개의 포스트

[논문리뷰] AthenaBench: A Dynamic Benchmark for Evaluating LLMs in Cyber Threat Intelligence

현재 LLM(Large Language Model) 벤치마크들이 정적 데이터셋에 의존하고 암기 능력을 주로 평가하여 현실적인 CTI(Cyber Threat Intelligence) 추론 능력을 제대로 측정하지 못하는 문제를 해결하고자 합니다.

#Review #LLM Benchmarking #Cyber Threat Intelligence (CTI)#Dynamic Evaluation #CTI Reasoning #Vulnerability Prediction #Threat Actor Attribution #Risk Mitigation #Natural Language Processing

2025년 11월 9일