[논문리뷰] FINESSE-Bench: A Hierarchical Benchmark Suite for Financial Domain Knowledge and Technical Analysis in Large Language Models본 논문은 기존의 금융 벤치마크가 지닌 한계를 극복하고 LLM의 실질적인 금융 전문 역량을 정밀하게 진단하기 위해 FINESSE-Bench를 제안한다.#Review#Large Language Models#Financial Benchmarking#Difficulty Hierarchy#Technical Analysis#LLM-as-Judge#Professional Competence#Financial Reasoning2026년 5월 18일댓글 수 로딩 중
[논문리뷰] FinSearchComp: Towards a Realistic, Expert-Level Evaluation of Financial Search and Reasoning본 연구는 LLM 기반 에이전트의 현실적인 금융 데이터 검색 및 추론 능력을 평가하기 위한 종단 간(end-to-end) 벤치마크 의 부재를 해결하는 것을 목표로 합니다.#Review#Financial LLMs#Agent Benchmarking#Open-domain Search#Financial Reasoning#Time-Sensitive Data#Multi-hop QA#Tool Use2025년 9월 19일댓글 수 로딩 중
[논문리뷰] QuantAgent: Price-Driven Multi-Agent LLMs for High-Frequency Trading기존 LLM 기반 금융 시스템이 텍스트 기반 입력에 주로 의존하여 고주파 매매(HFT)의 속도 및 정확성 요구사항에 부적합하다는 한계를 해결하고자 합니다.#Review#High-Frequency Trading#Multi-Agent Systems#Large Language Models#Technical Analysis#Algorithmic Trading#Financial Reasoning#Price-Driven Signals2025년 9월 15일댓글 수 로딩 중
[논문리뷰] Fin-PRM: A Domain-Specialized Process Reward Model for Financial Reasoning in Large Language Models본 논문은 기존 일반 목적 Process Reward Models (PRMs)이 금융과 같은 도메인 특화 태스크에서 요구되는 정밀성, 사실성, 논리적 일관성을 충족하지 못하는 문제를 해결하는 것을 목표로 합니다.#Review#Large Language Models#Process Reward Models#Financial Reasoning#Domain Specialization#RLHF#Best-of-N Selection#Data Curation2025년 8월 22일댓글 수 로딩 중