[논문리뷰] Learning Smooth Time-Varying Linear Policies with an Action Jacobian Penalty본 논문은 강화 학습(DRL)을 통해 학습된 제어 정책이 생성하는 비현실적인 고주파수 제어 신호 문제를 해결하는 것을 목표로 합니다.#Review#Reinforcement Learning#Motion Control#Robotics#Character Animation#Linear Policies#Action Jacobian Penalty#Policy Regularization#Sim-to-Real2026년 2월 22일댓글 수 로딩 중