[논문리뷰] PixelGen: Pixel Diffusion Beats Latent Diffusion with Perceptual LossarXiv에 게시된 'PixelGen: Pixel Diffusion Beats Latent Diffusion with Perceptual Loss' 논문에 대한 자세한 리뷰입니다.#Review#Pixel Diffusion#Perceptual Loss#Latent Diffusion#Image Generation#LPIPS#DINOv2#x-prediction#End-to-End Generation2026년 2월 2일댓글 수 로딩 중
[논문리뷰] Both Semantics and Reconstruction Matter: Making Representation Encoders Ready for Text-to-Image Generation and EditingarXiv에 게시된 'Both Semantics and Reconstruction Matter: Making Representation Encoders Ready for Text-to-Image Generation and Editing' 논문에 대한 자세한 리뷰입니다.#Review#Text-to-Image Generation#Image Editing#Representation Encoders#Latent Diffusion Models#Variational Autoencoder (VAE)#Semantic Reconstruction#Off-manifold Latents#DINOv22025년 12월 21일댓글 수 로딩 중
[논문리뷰] One Patch to Caption Them All: A Unified Zero-Shot Captioning FrameworkGiuseppe Amato이 arXiv에 게시한 'One Patch to Caption Them All: A Unified Zero-Shot Captioning Framework' 논문에 대한 자세한 리뷰입니다.#Review#Zero-Shot Captioning#Region-Level Captioning#Vision Transformers#DINOv2#Patch-Centric#Modality Gap Mitigation#Visual-Language Models2025년 10월 13일댓글 수 로딩 중