[논문리뷰] VA-π: Variational Policy Alignment for Pixel-Aware Autoregressive GenerationYicong Li이 arXiv에 게시한 'VA-π: Variational Policy Alignment for Pixel-Aware Autoregressive Generation' 논문에 대한 자세한 리뷰입니다.2025년 12월 25일댓글 수 로딩 중
[논문리뷰] Boundary-Guided Policy Optimization for Memory-efficient RL of Diffusion Large Language ModelsarXiv에 게시된 'Boundary-Guided Policy Optimization for Memory-efficient RL of Diffusion Large Language Models' 논문에 대한 자세한 리뷰입니다.2025년 10월 15일댓글 수 로딩 중
[논문리뷰] Variational Reasoning for Language ModelsarXiv에 게시된 'Variational Reasoning for Language Models' 논문에 대한 자세한 리뷰입니다.2025년 9월 29일댓글 수 로딩 중