#Inference-time Steering

3개의 포스트

[논문리뷰] StressDream: Steering Video World Models for Robust Policy Evaluation and Improvement

본 연구는 기존 Video World Models가 nominal한 미래 예측에만 의존하여, 로봇 정책의 실패 가능성이나 위험한 이벤트를 과소평가(under-explore)하는 문제를 해결하고자 합니다.

#Review #Video World Models #Diffusion Models #Inference-time Steering #Robust Policy Evaluation #Typical Set #Vision-Language Models

2026년 6월 1일

[논문리뷰] Stitched Value Model for Diffusion Alignment

본 논문은 diffusion model의 효과적인 alignment를 위해 noisy latent regime에서 정확하고 효율적인 Value Function을 구축하는 문제를 다룬다.

#Review #Diffusion Models #Alignment #Value Function #Model Stitching #Reward Modeling #Inference-time Steering #Reinforcement Learning

2026년 5월 20일

[논문리뷰] When Personalization Misleads: Understanding and Mitigating Hallucinations in Personalized LLMs

개인화된 대규모 언어 모델(LLM)이 사용자 만족도를 높이는 동시에 사실적 추론을 왜곡 하여 개인화 유도 환각(personalization-induced hallucinations) 을 발생시키는 현상을 이해하고 해결하는 것이 목표입니다.

#Review #Personalized LLMs #Hallucination Mitigation #Factual Reasoning #Representation Entanglement #Inference-time Steering #Question Answering #Factuality Preservation

2026년 1월 18일