본문으로 건너뛰기

#DPO

7개의 포스트

[논문리뷰] OmniGAIA: Towards Native Omni-Modal AI Agents

댓글 수 로딩 중

[논문리뷰] TreeCUA: Efficiently Scaling GUI Automation with Tree-Structured Verifiable Evolution

댓글 수 로딩 중

[논문리뷰] Personalized Safety Alignment for Text-to-Image Diffusion Models

댓글 수 로딩 중

[논문리뷰] DRIFT: Learning from Abundant User Dissatisfaction in Real-World Preference Learning

댓글 수 로딩 중