#Self-Supervised

1개의 포스트

[논문리뷰] Reinforcement World Model Learning for LLM-based Agents

대규모 언어 모델(LLM) 기반 에이전트가 현실 환경에서 행동 결과(action consequences)를 예측하고 환경 역학에 적응하는 데 겪는 어려움을 해결하는 것을 목표로 합니다.

#Review #LLM-based Agents #World Model Learning #Reinforcement Learning #Self-Supervised #Environment Dynamics #Sim-to-Real Reward #Textual States

2026년 2월 5일