[논문리뷰] How can embedding models bind concepts?본 논문은 최신 Vision-Language Embedding Models인 CLIP이 개념을 개별적으로는 잘 인지하면서도, 이들을 올바르게 조합하여 객체를 구성하는 Concept Binding에는 실패하는 문제에 주목합니다.#Review#Concept Binding#Embedding Models#Compositional Generalization#Multiplicative Interaction#Representation Geometry#CLIP#Transformer2026년 5월 31일댓글 수 로딩 중
[논문리뷰] Composing Concepts from Images and Videos via Concept-prompt Binding본 논문은 복잡한 시각적 개념(예: 스타일, 모션)을 이미지 및 비디오 입력에서 정확하게 추출하고, 이를 유연하게 조합하여 일관된 시각적 출력을 생성하는 문제를 해결하고자 합니다.#Review#Visual Concept Composition#Diffusion Models#Text-to-Video Generation#Concept Binding#Hierarchical Binder#Diversify-and-Absorb Mechanism#Temporal Disentanglement#One-shot Learning2025년 12월 10일댓글 수 로딩 중