[논문리뷰] StressDream: Steering Video World Models for Robust Policy Evaluation and Improvement본 연구는 기존 Video World Models가 nominal한 미래 예측에만 의존하여, 로봇 정책의 실패 가능성이나 위험한 이벤트를 과소평가(under-explore)하는 문제를 해결하고자 합니다.#Review#Video World Models#Diffusion Models#Inference-time Steering#Robust Policy Evaluation#Typical Set#Vision-Language Models2026년 6월 1일댓글 수 로딩 중
[논문리뷰] Stitched Value Model for Diffusion Alignment본 논문은 diffusion model의 효과적인 alignment를 위해 noisy latent regime에서 정확하고 효율적인 Value Function을 구축하는 문제를 다룬다.#Review#Diffusion Models#Alignment#Value Function#Model Stitching#Reward Modeling#Inference-time Steering#Reinforcement Learning2026년 5월 20일댓글 수 로딩 중
[논문리뷰] When Personalization Misleads: Understanding and Mitigating Hallucinations in Personalized LLMs개인화된 대규모 언어 모델(LLM)이 사용자 만족도를 높이는 동시에 사실적 추론을 왜곡 하여 개인화 유도 환각(personalization-induced hallucinations) 을 발생시키는 현상을 이해하고 해결하는 것이 목표입니다.#Review#Personalized LLMs#Hallucination Mitigation#Factual Reasoning#Representation Entanglement#Inference-time Steering#Question Answering#Factuality Preservation2026년 1월 18일댓글 수 로딩 중