[논문리뷰] Text-to-Image Models Need Less from Text Encoders Than You Think본 논문은 최신 Text-to-Image(TTI) 모델들이 복잡한 Text Encoder에 크게 의존하는 현상을 분석하고, 과연 이러한 모델들이 실제로 풍부한 문맥 정보를 활용하는지 의문을 제기합니다.#Review#Text-to-Image#Diffusion Transformer#Text Encoder#Contextless Embedding#Bag-of-Position-Tagged-Words#Compositionality2026년 6월 8일댓글 수 로딩 중