[논문리뷰] PRELUDE: A Benchmark Designed to Require Global Comprehension and Reasoning over Long Contexts이 논문은 기존 장문 컨텍스트 이해 벤치마크의 한계(기억력 의존, 얕은 추론, 전역적 의존성 부족 등)를 해결하고, 대규모 언어 모델(LLMs)의 전역적 이해(global comprehension) 및 심층 추론(deep reasoning) 능력을 엄격하게 평가하기 위한 새로운 벤치마크인 PRELUDE 를 제안합니다.#Review#Long-Context Understanding#Reasoning Benchmark#LLMs Evaluation#Natural Language Processing#Global Comprehension#Fluid Intelligence#Prequel Entailment#RAG2025년 8월 15일댓글 수 로딩 중