#Value Function

2개의 포스트

[논문리뷰] Stitched Value Model for Diffusion Alignment

본 논문은 diffusion model의 효과적인 alignment를 위해 noisy latent regime에서 정확하고 효율적인 Value Function을 구축하는 문제를 다룬다.

#Review #Diffusion Models #Alignment #Value Function #Model Stitching #Reward Modeling #Inference-time Steering #Reinforcement Learning

2026년 5월 20일

[논문리뷰] ViVa: A Video-Generative Value Model for Robot Reinforcement Learning

본 논문은 로봇 조작 과업에서 기존 VLM(Vision-Language Model) 기반 가치 함수가 가진 시간적 역학(Temporal Dynamics) 이해 부족 문제를 해결하고자 합니다.

#Review #Robot Reinforcement Learning #Video-Generative Model #Value Function #Embodied AI #Future Prediction #Spatiotemporal Priors

2026년 4월 9일