[논문리뷰] Spreadsheet-RL: Advancing Large Language Model Agents on Realistic Spreadsheet Tasks via Reinforcement Learning본 논문은 기존의 프롬프트 기반 스프레드시트 에이전트가 실제 비즈니스 환경의 복잡하고 다단계적인 워크플로우를 처리하는 데 한계가 있다는 문제 의식에서 출발한다.#Review#Large Language Model Agents#Reinforcement Learning#Spreadsheet Automation#GRPO#Excel Environment#Domain-Spreadsheet Benchmark2026년 5월 21일댓글 수 로딩 중
[논문리뷰] Mem-π: Adaptive Memory through Learning When and What to Generate본 논문은 기존 LLM 에이전트의 정적인 메모리 검색 패러다임이 갖는 한계를 극복하기 위해 제안되었습니다. 현재의 메모리 증강 에이전트들은 주로 외부 저장소에서 과거의 경험을 검색하는 방식에 의존하지만, 이러한 검색된 데이터는 현재의 에이전트 맥락과 맞지 않거나 지나치게 특수하여 범용성이 떨어지는 문제가 있습니다.#Review#Large Language Model Agents#Generative Memory#Reinforcement Learning#Adaptive Memory#Abstention Policy#Decoupled Policy Optimization2026년 5월 20일댓글 수 로딩 중