[논문리뷰] Qwen-Image-2.0-RL Technical Report본 연구는 Qwen-Image-2.0 diffusion 모델이 가진 생성 품질과 지시 이행 능력 사이의 간극을 좁히고, 복잡한 편집 태스크에서 일관된 성능을 확보하기 위해 수행되었다.#Review#RLHF#On-policy Distillation#Diffusion Models#Reward Modeling#Flow Matching#GRPO#Qwen-Image-Bench2026년 6월 28일댓글 수 로딩 중