본문으로 건너뛰기

#Diffusion Transformer (DiT)

7개의 포스트

[논문리뷰] DyaDiT: A Multi-Modal Diffusion Transformer for Socially Favorable Dyadic Gesture Generation

댓글 수 로딩 중

[논문리뷰] QuantVLA: Scale-Calibrated Post-Training Quantization for Vision-Language-Action Models

댓글 수 로딩 중

[논문리뷰] FSVideo: Fast Speed Video Diffusion Model in a Highly-Compressed Latent Space

댓글 수 로딩 중

[논문리뷰] DeCo: Frequency-Decoupled Pixel Diffusion for End-to-End Image Generation

댓글 수 로딩 중

[논문리뷰] Mantis: A Versatile Vision-Language-Action Model with Disentangled Visual Foresight

댓글 수 로딩 중