본문으로 건너뛰기

#Text-to-Image

30개의 포스트

[논문리뷰] PixVerve: Advancing Native UHR Image Generation to 100MP with a Large-Scale High-Quality Dataset

댓글 수 로딩 중

[논문리뷰] HybridStitch: Pixel and Timestep Level Model Stitching for Diffusion Acceleration

댓글 수 로딩 중

[논문리뷰] TDM-R1: Reinforcing Few-Step Diffusion Models with Non-Differentiable Reward

댓글 수 로딩 중

[논문리뷰] PureCC: Pure Learning for Text-to-Image Concept Customization

댓글 수 로딩 중

[논문리뷰] Enhancing Spatial Understanding in Image Generation via Reward Modeling

댓글 수 로딩 중

[논문리뷰] Semantic Routing: Exploring Multi-Layer LLM Feature Weighting for Diffusion Transformers

댓글 수 로딩 중

[논문리뷰] Scientific Image Synthesis: Benchmarking, Methodologies, and Downstream Utility

댓글 수 로딩 중

[논문리뷰] Think-Then-Generate: Reasoning-Aware Text-to-Image Diffusion with LLM Encoders

댓글 수 로딩 중

[논문리뷰] Alterbute: Editing Intrinsic Attributes of Objects in Images

댓글 수 로딩 중

[논문리뷰] Alchemist: Unlocking Efficiency in Text-to-Image Model Training via Meta-Gradient Data Selection

댓글 수 로딩 중

[논문리뷰] LongCat-Image Technical Report

댓글 수 로딩 중

[논문리뷰] Aligned but Stereotypical? The Hidden Influence of System Prompts on Social Bias in LVLM-Based Text-to-Image Models

댓글 수 로딩 중

[논문리뷰] Seedream 4.0: Toward Next-generation Multimodal Image Generation

댓글 수 로딩 중

[논문리뷰] Can Understanding and Generation Truly Benefit Together -- or Just Coexist?

댓글 수 로딩 중

[논문리뷰] RewardDance: Reward Scaling in Visual Generation

댓글 수 로딩 중

[논문리뷰] Discrete Noise Inversion for Next-scale Autoregressive Text-based Image Editing

댓글 수 로딩 중

[논문리뷰] TempFlow-GRPO: When Timing Matters for GRPO in Flow Models

댓글 수 로딩 중

[논문리뷰] DialectGen: Benchmarking and Improving Dialect Robustness in Multimodal Generation

댓글 수 로딩 중

[논문리뷰] Large Scale Diffusion Distillation via Score-Regularized Continuous-Time Consistency

댓글 수 로딩 중