#Large language models

2개의 포스트

[논문리뷰] Graph-Native Reinforcement Learning Enables Traceable Scientific Hypothesis Generation through Conceptual Recombination

본 연구는 기존 LLM이 과학적 가설 생성 시 fluent한 텍스트를 생성하더라도 intermediate reasoning의 추적 가능성(traceability)이 낮고 인과적 관계가 불분명하다는 한계를 해결하고자 한다 .

#Review #Graph-native reasoning #Scientific hypothesis generation #Reinforcement learning #Materials design #Large language models #GRPO

2026년 7월 1일

[논문리뷰] AgentProcessBench: Diagnosing Step-Level Process Quality in Tool-Using Agents

LLMs가 tool-using agent로 발전하면서 외부 환경과 상호작용하는 능력은 크게 향상되었지만, long-horizon 상호작용에서는 여전히 취약합니다.

#Review #Large language models #Process reward models #Tool-using agents #Step-level evaluation #Agent trajectories #Benchmark

2026년 3월 17일