[논문리뷰] s2n-bignum-bench: A practical benchmark for evaluating low-level code reasoning of LLMs본 논문은 LLM이 산업용 cryptographic assembly 코드를 검증할 수 있는지를 평가하기 위해, AWS의 s2n-bignum 라이브러리에서 추출한 형식 명세와 HOL Light 증명 스크립트 생성 과제를 묶은 실용 벤치마크를 제안합니다.#Review#Formal Verification#Theorem Proving#HOL Light#LLM for Code#Cryptographic Assembly#Neurosymbolic AI2026년 3월 22일댓글 수 로딩 중
[논문리뷰] Tensor Logic: The Language of AIAI 분야의 발전이 프로그래밍 언어의 한계로 인해 저해되고 있다는 문제의식에서 출발합니다. PyTorch나 TensorFlow와 같은 라이브러리가 자동 미분과 GPU 가속을 제공하지만, 자동 추론 및 지식 습득 기능이 부족하며, LISP나 Prolog 같은 심볼릭 AI 언어는 확장성과 학습 지원이 미비합니다.#Review#Tensor Logic#Neurosymbolic AI#Logic Programming#Tensor Algebra#Deep Learning#Automated Reasoning#Embedding Space2025년 10월 15일댓글 수 로딩 중