본문으로 건너뛰기

#CLIP

15개의 포스트

[논문리뷰] Large Multimodal Models as General In-Context Classifiers

댓글 수 로딩 중

[논문리뷰] HDINO: A Concise and Efficient Open-Vocabulary Detector

댓글 수 로딩 중

[논문리뷰] Half-Truths Break Similarity-Based Retrieval

댓글 수 로딩 중

[논문리뷰] Compositional Generalization Requires Linear, Orthogonal Representations in Vision Embedding Models

댓글 수 로딩 중

[논문리뷰] Processing and acquisition traces in visual encoders: What does CLIP know about your camera?

댓글 수 로딩 중