[논문리뷰] Code-Space Response Oracles: Generating Interpretable Multi-Agent Policies with Large Language Models기존 다중 에이전트 강화 학습(MARL), 특히 Policy-Space Response Oracles (PSRO) 에서 심층 강화 학습(DRL) 오라클 이 생성하는 '블랙박스' 신경망 정책의 불투명성 문제를 해결하고, 인간이 해석 가능한 정책 을 생성하는 새로운 프레임워크를 제시하는 것이 목표입니다.#Review#Multi-Agent Reinforcement Learning#Policy-Space Response Oracles#Large Language Models#Program Synthesis#Interpretable AI#Game Theory#Code Generation2026년 3월 11일댓글 수 로딩 중
[논문리뷰] Schoenfeld's Anatomy of Mathematical Reasoning by Language Models대규모 언어 모델(LLM)의 추론 과정은 표면적인 통계 외에는 그 인지 구조와 단계를 파악하기 어렵습니다.#Review#LLM Reasoning#Cognitive Science#Schoenfeld's Episode Theory#Mathematical Problem Solving#Reasoning Dynamics#Interpretable AI#Behavioral Analysis2025년 12월 25일댓글 수 로딩 중
[논문리뷰] CoTox: Chain-of-Thought-Based Molecular Toxicity Reasoning and Prediction기존 AI/ML 독성 예측 모델의 한계(데이터 의존성, 해석 불가능성)와 LLM 기반 접근법의 문제점(SMILES 이해 부족, 생물학적 맥락 부재, 추론 비활용)을 극복하는 것을 목표로 합니다.#Review#Toxicity Prediction#Large Language Model#Chain-of-Thought#Drug Development#Cheminformatics#Interpretable AI#IUPAC Nomenclature2025년 8월 7일댓글 수 로딩 중
[논문리뷰] AlphaQuanter: An End-to-End Tool-Orchestrated Agentic Reinforcement Learning Framework for Stock Trading본 논문은 기존 대규모 언어 모델(LLM) 기반 자동화된 주식 거래 시스템의 비효율성, 신호 불일치, 전략 학습의 비일관성 등의 한계를 해결하고자 합니다.#Review#Automated Trading#Reinforcement Learning#LLM Agents#Tool Orchestration#Financial Markets#Algorithmic Trading#Interpretable AI#ReAct2025년 10월 22일댓글 수 로딩 중