[논문리뷰] Text-to-Image Models Need Less from Text Encoders Than You Think본 논문은 최신 Text-to-Image(TTI) 모델들이 복잡한 Text Encoder에 크게 의존하는 현상을 분석하고, 과연 이러한 모델들이 실제로 풍부한 문맥 정보를 활용하는지 의문을 제기합니다.#Review#Text-to-Image#Diffusion Transformer#Text Encoder#Contextless Embedding#Bag-of-Position-Tagged-Words#Compositionality2026년 6월 8일댓글 수 로딩 중
[논문리뷰] GRAN-TED: Generating Robust, Aligned, and Nuanced Text Embedding for Diffusion Models본 논문은 텍스트-이미지(T2I) 및 텍스트-비디오(T2V) 확산 모델에서 핵심 구성 요소인 텍스트 인코더의 두 가지 주요 과제를 해결하고자 합니다.#Review#Text Encoder#Diffusion Models#Text Embedding#Evaluation Benchmark#MLLM Fine-tuning#Layer-wise Weighting#Text-to-Image Generation#Text-to-Video Generation2025년 12월 29일댓글 수 로딩 중