[논문리뷰] Dual-View Training for Instruction-Following Information RetrievalarXiv에 게시된 'Dual-View Training for Instruction-Following Information Retrieval' 논문에 대한 자세한 리뷰입니다.#Review#Instruction-Following#Information Retrieval#Dual-View Training#Polarity Reversal#Contrastive Learning2026년 4월 21일댓글 수 로딩 중
[논문리뷰] MegaStyle: Constructing Diverse and Scalable Style Dataset via Consistent Text-to-Image Style MappingarXiv에 게시된 'MegaStyle: Constructing Diverse and Scalable Style Dataset via Consistent Text-to-Image Style Mapping' 논문에 대한 자세한 리뷰입니다.#Review#MegaStyle#Style Transfer#Data Curation#Diffusion Transformer#Contrastive Learning2026년 4월 9일댓글 수 로딩 중
[논문리뷰] π-StepNFT: Wider Space Needs Finer Steps in Online RL for Flow-based VLAsarXiv에 게시된 'π-StepNFT: Wider Space Needs Finer Steps in Online RL for Flow-based VLAs' 논문에 대한 자세한 리뷰입니다.#Review#Reinforcement Learning (RL)#Flow-based Models#Vision-Language-Action (VLA) Models#Online Learning#Stochastic Differential Equation (SDE)#Contrastive Learning#Embodied AI#Robotics2026년 3월 8일댓글 수 로딩 중
[논문리뷰] SLER-IR: Spherical Layer-wise Expert Routing for All-in-One Image RestorationDizhe Zhang이 arXiv에 게시한 'SLER-IR: Spherical Layer-wise Expert Routing for All-in-One Image Restoration' 논문에 대한 자세한 리뷰입니다.#Review#Image Restoration#Mixture of Experts#Degradation Representation#Spherical Embedding#Contrastive Learning#Adaptive Routing#All-in-One Model#Global-Local Fusion2026년 3월 8일댓글 수 로딩 중
[논문리뷰] DREAM: Where Visual Understanding Meets Text-to-Image GenerationSatya Narayan Shukla이 arXiv에 게시한 'DREAM: Where Visual Understanding Meets Text-to-Image Generation' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal Learning#Visual Representation Learning#Text-to-Image Generation#Masked Autoregressive Models#Contrastive Learning#Masking Warmup#Semantically Aligned Decoding2026년 3월 3일댓글 수 로딩 중
[논문리뷰] InfoNCE Induces Gaussian DistributionarXiv에 게시된 'InfoNCE Induces Gaussian Distribution' 논문에 대한 자세한 리뷰입니다.#Review#Contrastive Learning#InfoNCE Loss#Gaussian Distribution#Representation Learning#Self-Supervised Learning#Hyperspherical Uniformity#Thin-Shell Concentration2026년 3월 1일댓글 수 로딩 중
[논문리뷰] MoBind: Motion Binding for Fine-Grained IMU-Video Pose AlignmentarXiv에 게시된 'MoBind: Motion Binding for Fine-Grained IMU-Video Pose Alignment' 논문에 대한 자세한 리뷰입니다.#Review#Multi-modal Alignment#Contrastive Learning#IMU-Video Fusion#Pose Estimation#Temporal Synchronization#Human Motion Analysis#Hierarchical Learning2026년 2월 25일댓글 수 로딩 중
[논문리뷰] CGPT: Cluster-Guided Partial Tables with LLM-Generated Supervision for Table RetrievalarXiv에 게시된 'CGPT: Cluster-Guided Partial Tables with LLM-Generated Supervision for Table Retrieval' 논문에 대한 자세한 리뷰입니다.#Review#Table Retrieval#LLM Supervision#K-means Clustering#Partial Table#Contrastive Learning#Embedding Fine-tuning#Synthetic Query Generation2026년 1월 26일댓글 수 로딩 중
[논문리뷰] OpenVision 3: A Family of Unified Visual Encoder for Both Understanding and GenerationarXiv에 게시된 'OpenVision 3: A Family of Unified Visual Encoder for Both Understanding and Generation' 논문에 대한 자세한 리뷰입니다.#Review#Unified Visual Encoder#Image Understanding#Image Generation#VAE#Vision Transformer#Multimodal Learning#Reconstruction#Contrastive Learning2026년 1월 22일댓글 수 로딩 중
[논문리뷰] Qwen3-VL-Embedding and Qwen3-VL-Reranker: A Unified Framework for State-of-the-Art Multimodal Retrieval and RankingarXiv에 게시된 'Qwen3-VL-Embedding and Qwen3-VL-Reranker: A Unified Framework for State-of-the-Art Multimodal Retrieval and Ranking' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal Retrieval#Multimodal Ranking#Foundation Models#Embedding Models#Reranking Models#Contrastive Learning#Knowledge Distillation#Matryoshka Representation Learning#Quantization-Aware Training2026년 1월 11일댓글 수 로딩 중
[논문리뷰] Parallel Latent Reasoning for Sequential RecommendationYuning Jiang이 arXiv에 게시한 'Parallel Latent Reasoning for Sequential Recommendation' 논문에 대한 자세한 리뷰입니다.#Review#Sequential Recommendation#Latent Reasoning#Parallel Processing#Computational Scaling#Mixture of Experts#Contrastive Learning#Transformer Architecture2026년 1월 6일댓글 수 로딩 중
[논문리뷰] Towards Scalable Pre-training of Visual Tokenizers for GenerationarXiv에 게시된 'Towards Scalable Pre-training of Visual Tokenizers for Generation' 논문에 대한 자세한 리뷰입니다.#Review#Visual Tokenizers#Pre-training#Latent Diffusion Models#Generative Models#Vision Transformer#Contrastive Learning#Self-Supervised Learning#Scaling Laws2025년 12월 15일댓글 수 로딩 중
[논문리뷰] Mitigating Object and Action Hallucinations in Multimodal LLMs via Self-Augmented Contrastive AlignmentarXiv에 게시된 'Mitigating Object and Action Hallucinations in Multimodal LLMs via Self-Augmented Contrastive Alignment' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal LLMs#Video Understanding#Hallucination Mitigation#Object Hallucination#Action Hallucination#Contrastive Learning#Self-Augmentation#Tracklet-Phrase Alignment2025년 12월 4일댓글 수 로딩 중
[논문리뷰] Pillar-0: A New Frontier for Radiology Foundation ModelsarXiv에 게시된 'Pillar-0: A New Frontier for Radiology Foundation Models' 논문에 대한 자세한 리뷰입니다.#Review#Radiology Foundation Model#Volumetric Imaging#Multi-window Tokenization#Multi-scale Attention#Contrastive Learning#Clinical Evaluation#Data Efficiency#Medical Imaging2025년 11월 24일댓글 수 로딩 중
[논문리뷰] Φeat: Physically-Grounded Feature RepresentationarXiv에 게시된 'Φeat: Physically-Grounded Feature Representation' 논문에 대한 자세한 리뷰입니다.#Review#Self-supervised Learning#Physically-Grounded Features#Material Representation#Intrinsic Scene Understanding#Vision Transformer#Synthetic Data#Contrastive Learning2025년 11월 18일댓글 수 로딩 중
[논문리뷰] Large Language Models Meet Extreme Multi-label Classification: Scaling and Multi-modal FrameworkarXiv에 게시된 'Large Language Models Meet Extreme Multi-label Classification: Scaling and Multi-modal Framework' 논문에 대한 자세한 리뷰입니다.#Review#Extreme Multi-label Classification (XMC)#Large Language Models (LLMs)#Multi-modal Learning#Dual-decoder Learning#Vision Transformers#Contrastive Learning#Prompt Engineering2025년 11월 18일댓글 수 로딩 중
[논문리뷰] Llama-Embed-Nemotron-8B: A Universal Text Embedding Model for Multilingual and Cross-Lingual TasksarXiv에 게시된 'Llama-Embed-Nemotron-8B: A Universal Text Embedding Model for Multilingual and Cross-Lingual Tasks' 논문에 대한 자세한 리뷰입니다.#Review#Text Embedding#Multilingual#Cross-Lingual#Contrastive Learning#Model Merging#Synthetic Data Generation#Instruction-Tuning#LLM2025년 11월 10일댓글 수 로딩 중
[논문리뷰] Routing Matters in MoE: Scaling Diffusion Transformers with Explicit Routing GuidancearXiv에 게시된 'Routing Matters in MoE: Scaling Diffusion Transformers with Explicit Routing Guidance' 논문에 대한 자세한 리뷰입니다.#Review#Mixture-of-Experts (MoE)#Diffusion Transformers (DiTs)#Routing Guidance#Semantic Specialization#Contrastive Learning#Image Generation#Flow Matching2025년 10월 29일댓글 수 로딩 중
[논문리뷰] E^2Rank: Your Text Embedding can Also be an Effective and Efficient Listwise RerankerarXiv에 게시된 'E^2Rank: Your Text Embedding can Also be an Effective and Efficient Listwise Reranker' 논문에 대한 자세한 리뷰입니다.#Review#Text Embedding#Listwise Reranking#Information Retrieval#Pseudo Relevance Feedback#Contrastive Learning#Multi-task Learning#Efficiency#LLM-based Ranking2025년 10월 28일댓글 수 로딩 중
[논문리뷰] ProCLIP: Progressive Vision-Language Alignment via LLM-based EmbedderZonghao Guo이 arXiv에 게시한 'ProCLIP: Progressive Vision-Language Alignment via LLM-based Embedder' 논문에 대한 자세한 리뷰입니다.#Review#Vision-Language Models#CLIP#LLM-based Embedder#Knowledge Distillation#Contrastive Learning#Curriculum Learning#Multimodal Alignment#Progressive Alignment2025년 10월 22일댓글 수 로딩 중
[논문리뷰] Towards Mixed-Modal Retrieval for Universal Retrieval-Augmented GenerationarXiv에 게시된 'Towards Mixed-Modal Retrieval for Universal Retrieval-Augmented Generation' 논문에 대한 자세한 리뷰입니다.#Review#Universal RAG#Multimodal Retrieval#Mixed-Modal Data Generation#Vision-Language Models#Contrastive Learning#Matryoshka Representation Learning2025년 10월 21일댓글 수 로딩 중
[논문리뷰] OmniVinci: Enhancing Architecture and Data for Omni-Modal Understanding LLMarXiv에 게시된 'OmniVinci: Enhancing Architecture and Data for Omni-Modal Understanding LLM' 논문에 대한 자세한 리뷰입니다.#Review#Omni-Modal LLM#Multimodal Understanding#Vision-Audio Alignment#Temporal Reasoning#Data Curation#Foundation Models#Contrastive Learning#Rotary Time Embedding2025년 10월 20일댓글 수 로딩 중
[논문리뷰] WithAnyone: Towards Controllable and ID Consistent Image GenerationarXiv에 게시된 'WithAnyone: Towards Controllable and ID Consistent Image Generation' 논문에 대한 자세한 리뷰입니다.#Review#Identity-Consistent Generation#Text-to-Image Diffusion#Copy-Paste Artifacts#Contrastive Learning#Multi-Identity Dataset#Controllable Generation#ID-Preservation2025년 10월 17일댓글 수 로딩 중
[논문리뷰] UniME-V2: MLLM-as-a-Judge for Universal Multimodal Embedding LearningZiyong Feng이 arXiv에 게시한 'UniME-V2: MLLM-as-a-Judge for Universal Multimodal Embedding Learning' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal Embeddings#MLLM-as-a-Judge#Hard Negative Mining#Semantic Alignment#Representation Learning#Reranking#Contrastive Learning2025년 10월 16일댓글 수 로딩 중
[논문리뷰] FG-CLIP 2: A Bilingual Fine-grained Vision-Language Alignment ModelDawei Liang이 arXiv에 게시한 'FG-CLIP 2: A Bilingual Fine-grained Vision-Language Alignment Model' 논문에 대한 자세한 리뷰입니다.#Review#Vision-Language Alignment#Fine-grained Understanding#Bilingual Model#Contrastive Learning#Multimodal Retrieval#Open-Vocabulary Detection#Region-Text Matching2025년 10월 16일댓글 수 로딩 중
[논문리뷰] Scaling Language-Centric Omnimodal Representation LearningarXiv에 게시된 'Scaling Language-Centric Omnimodal Representation Learning' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal Embeddings#MLLMs#Contrastive Learning#Cross-modal Alignment#Generative Pretraining#Representation Learning#Scaling Laws2025년 10월 15일댓글 수 로딩 중
[논문리뷰] SAIL-Embedding Technical Report: Omni-modal Embedding Foundation ModelarXiv에 게시된 'SAIL-Embedding Technical Report: Omni-modal Embedding Foundation Model' 논문에 대한 자세한 리뷰입니다.#Review#Omni-modal Embedding#Multimodal Learning#Recommendation Systems#Hard Negative Mining#Contrastive Learning#Large Language Models (LLMs)#Data Balancing#Multitask Learning2025년 10월 15일댓글 수 로딩 중
[논문리뷰] GCPO: When Contrast Fails, Go GoldarXiv에 게시된 'GCPO: When Contrast Fails, Go Gold' 논문에 대한 자세한 리뷰입니다.#Review#Reinforcement Learning#LLMs Reasoning#Policy Optimization#Contrastive Learning#Chain of Thought#Reference Answers#Math Reasoning#Gold-Standard Answer2025년 10월 10일댓글 수 로딩 중
[논문리뷰] No Tokens Wasted: Leveraging Long Context in Biomedical Vision-Language ModelsXiao Xiao Sun이 arXiv에 게시한 'No Tokens Wasted: Leveraging Long Context in Biomedical Vision-Language Models' 논문에 대한 자세한 리뷰입니다.#Review#Biomedical Vision-Language Models#Long-context Modeling#Contrastive Learning#Token Efficiency#Zero-shot Classification#Medical Image Retrieval2025년 10월 8일댓글 수 로딩 중
[논문리뷰] Mind-the-Glitch: Visual Correspondence for Detecting Inconsistencies in Subject-Driven GenerationPeter Wonka이 arXiv에 게시한 'Mind-the-Glitch: Visual Correspondence for Detecting Inconsistencies in Subject-Driven Generation' 논문에 대한 자세한 리뷰입니다.#Review#Subject-Driven Generation#Visual Inconsistency Detection#Feature Disentanglement#Diffusion Models#Semantic Correspondence#Evaluation Metric#Spatial Localization#Contrastive Learning2025년 9월 29일댓글 수 로딩 중
[논문리뷰] Understand Before You Generate: Self-Guided Training for Autoregressive Image GenerationXihui Liu이 arXiv에 게시한 'Understand Before You Generate: Self-Guided Training for Autoregressive Image Generation' 논문에 대한 자세한 리뷰입니다.#Review#Autoregressive Models#Image Generation#Self-Supervised Learning#Visual Understanding#Masked Image Modeling#Contrastive Learning#Next-Token Prediction#LlamaGen2025년 9월 19일댓글 수 로딩 중
[논문리뷰] Modality Alignment with Multi-scale Bilateral Attention for Multimodal RecommendationDong-Ho Lee이 arXiv에 게시한 'Modality Alignment with Multi-scale Bilateral Attention for Multimodal Recommendation' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal Recommendation#Modality Alignment#Attention Mechanism#Dilated Convolution#Maximum Mean Discrepancy#Contrastive Learning#Dimensionality Reduction2025년 9월 12일댓글 수 로딩 중
[논문리뷰] Focusing by Contrastive Attention: Enhancing VLMs' Visual ReasoningBaolong Bi이 arXiv에 게시한 'Focusing by Contrastive Attention: Enhancing VLMs' Visual Reasoning' 논문에 대한 자세한 리뷰입니다.#Review#Vision-Language Models (VLMs)#Visual Reasoning#Attention Mechanisms#Contrastive Learning#Noise Suppression#Visual Complexity#Training-Free2025년 9월 9일댓글 수 로딩 중
[논문리뷰] NER Retriever: Zero-Shot Named Entity Retrieval with Type-Aware EmbeddingsOren Glickman이 arXiv에 게시한 'NER Retriever: Zero-Shot Named Entity Retrieval with Type-Aware Embeddings' 논문에 대한 자세한 리뷰입니다.#Review#Named Entity Retrieval#Zero-Shot Learning#Type-Aware Embeddings#Large Language Models (LLMs)#Contrastive Learning#Internal Representations#Information Retrieval2025년 9월 5일댓글 수 로딩 중
[논문리뷰] Efficient Code Embeddings from Code Generation ModelsHan Xiao이 arXiv에 게시한 'Efficient Code Embeddings from Code Generation Models' 논문에 대한 자세한 리뷰입니다.#Review#Code Embeddings#Code Generation Models#Autoregressive Backbones#Last-Token Pooling#Instruction Tuning#Contrastive Learning#Retrieval-Augmented Generation#MTEB Benchmark2025년 9월 1일댓글 수 로딩 중
[논문리뷰] Selective Contrastive Learning for Weakly Supervised Affordance GroundingJae-Pil Heo이 arXiv에 게시한 'Selective Contrastive Learning for Weakly Supervised Affordance Grounding' 논문에 대한 자세한 리뷰입니다.#Review#Weakly Supervised Learning#Affordance Grounding#Contrastive Learning#CLIP#Part Discovery#Object Localization#DINO#Generative Models2025년 8월 25일댓글 수 로딩 중
[논문리뷰] CARFT: Boosting LLM Reasoning via Contrastive Learning with Annotated Chain-of-Thought-based Reinforced Fine-TuningYulun Zhang이 arXiv에 게시한 'CARFT: Boosting LLM Reasoning via Contrastive Learning with Annotated Chain-of-Thought-based Reinforced Fine-Tuning' 논문에 대한 자세한 리뷰입니다.#Review#LLM Reasoning#Contrastive Learning#Reinforcement Learning#Fine-tuning#Chain-of-Thought (CoT)#Annotated Data#Model Stability2025년 8월 25일댓글 수 로딩 중
[논문리뷰] Refining Contrastive Learning and Homography Relations for Multi-Modal RecommendationShiqing Wu이 arXiv에 게시한 'Refining Contrastive Learning and Homography Relations for Multi-Modal Recommendation' 논문에 대한 자세한 리뷰입니다.#Review#Multi-modal Recommendation#Contrastive Learning#Graph Neural Network#Homography Relations#Meta-network#Orthogonal Constraint#Data Sparsity2025년 8월 21일댓글 수 로딩 중
[논문리뷰] UNCAGE: Contrastive Attention Guidance for Masked Generative Transformers in Text-to-Image GenerationKevin Galim이 arXiv에 게시한 'UNCAGE: Contrastive Attention Guidance for Masked Generative Transformers in Text-to-Image Generation' 논문에 대한 자세한 리뷰입니다.#Review#Text-to-Image Generation#Masked Generative Transformers#Compositional Generation#Attention Guidance#Unmasking Strategy#Contrastive Learning#Training-Free#Attribute Binding2025년 8월 13일댓글 수 로딩 중
[논문리뷰] Marco-Voice Technical ReportQingjuan Li이 arXiv에 게시한 'Marco-Voice Technical Report' 논문에 대한 자세한 리뷰입니다.#Review#Speech Synthesis#Voice Cloning#Emotion Control#Text-to-Speech#Disentanglement#Contrastive Learning#Flow Matching#Emotional Speech Dataset2025년 8월 8일댓글 수 로딩 중
[논문리뷰] CRINN: Contrastive Reinforcement Learning for Approximate Nearest Neighbor SearchJiwei Li이 arXiv에 게시한 'CRINN: Contrastive Reinforcement Learning for Approximate Nearest Neighbor Search' 논문에 대한 자세한 리뷰입니다.#Review#Approximate Nearest Neighbor Search#Reinforcement Learning#Large Language Models#Code Optimization#HNSW#Retrieval-Augmented Generation#Contrastive Learning2025년 8월 6일댓글 수 로딩 중