[논문리뷰] UniSteer: Text-Guided Flow Matching in Activation Space for Versatile LLM Steering본 논문은 LLM의 행동 제어를 위한 기존 Activation Steering 방법론들이 가진 확장성 및 구성적 제약 문제를 해결하기 위해 UniSteer를 제안합니다.#Review#LLM Steering#Activation Space#Flow Matching#Text-Guided Control#Activation Inversion#Multi-Constraint#Zero-shot Classification2026년 5월 28일댓글 수 로딩 중
[논문리뷰] MAEB: Massive Audio Embedding Benchmark오디오 임베딩 모델의 평가 프로토콜이 파편화되어 모델 비교 및 의미 있는 진척도 추적에 어려움이 있는 문제를 해결하고자 합니다. 이를 위해 광범위하고 통일된 평가 프레임워크 인 MAEB(Massive Audio Embedding Benchmark) 를 구축하여 범용 오디오 임베딩 모델 개발을 촉진하는 것을 목표로 합니다.#Review#Audio Embedding#Benchmark#Multimodal#Zero-shot Classification#Clustering#Representation Learning#MTEB Ecosystem#Cross-modal Audio-Text#Multilingual Audio2026년 2월 18일댓글 수 로딩 중
[논문리뷰] DanQing: An Up-to-Date Large-Scale Chinese Vision-Language Pre-training Dataset본 연구는 고품질의 중국어 이미지-텍스트 데이터 의 부족으로 인해 지연되었던 중국어 비전-언어 사전 훈련(VLP) 연구의 발전을 목표로 합니다. 최신 웹 데이터를 기반으로 한 대규모 고품질 중국어 크로스모달 데이터셋인 DanQing 을 구축하고, 이를 통해 중국어 VLP 모델의 성능을 향상시키는 것이 주된 목적입니다.#Review#Vision-Language Pre-training#Chinese Dataset#Data Filtering#Cross-modal Retrieval#Zero-shot Classification#Multimodal LLMs#SigLIP2026년 1월 15일댓글 수 로딩 중
[논문리뷰] VL-SAE: Interpreting and Enhancing Vision-Language Alignment with a Unified Concept Set본 논문은 Vision-Language Models (VLMs)의 vision-language alignment 메커니즘 에 대한 해석 가능성 부족 문제를 해결하고자 합니다.#Review#Vision-Language Models (VLMs)#Model Interpretability#Sparse Autoencoder (SAE)#Multi-modal Alignment#Concept Learning#Hallucination Elimination#Zero-shot Classification2025년 10월 29일댓글 수 로딩 중
[논문리뷰] No Tokens Wasted: Leveraging Long Context in Biomedical Vision-Language Models본 논문은 기존 VLM(Vision-Language Model)의 짧은 텍스트 컨텍스트 길이(일반적으로 77 토큰)로 인해 발생하는 바이오메디컬 이미지 캡션의 토큰 손실 문제 를 해결하고, 긴 컨텍스트 캡션이 모델 성능에 미치는 영향을 탐구하는 것을 목표로 합니다.#Review#Biomedical Vision-Language Models#Long-context Modeling#Contrastive Learning#Token Efficiency#Zero-shot Classification#Medical Image Retrieval2025년 10월 8일댓글 수 로딩 중