#Policy Regularization

1개의 포스트

[논문리뷰] Learning Smooth Time-Varying Linear Policies with an Action Jacobian Penalty

본 논문은 강화 학습(DRL)을 통해 학습된 제어 정책이 생성하는 비현실적인 고주파수 제어 신호 문제를 해결하는 것을 목표로 합니다.

#Review #Reinforcement Learning #Motion Control #Robotics #Character Animation #Linear Policies #Action Jacobian Penalty #Policy Regularization #Sim-to-Real

2026년 2월 22일