본문으로 건너뛰기

#Semantic Alignment

12개의 포스트

[논문리뷰] HDINO: A Concise and Efficient Open-Vocabulary Detector

댓글 수 로딩 중

[논문리뷰] Communication-Inspired Tokenization for Structured Image Representations

댓글 수 로딩 중

[논문리뷰] DualCamCtrl: Dual-Branch Diffusion Model for Geometry-Aware Camera-Controlled Video Generation

댓글 수 로딩 중

[논문리뷰] InternVideo-Next: Towards General Video Foundation Models without Video-Text Supervision

댓글 수 로딩 중

[논문리뷰] SemCoT: Accelerating Chain-of-Thought Reasoning through Semantically-Aligned Implicit Tokens

댓글 수 로딩 중

[논문리뷰] LucidFlux: Caption-Free Universal Image Restoration via a Large-Scale Diffusion Transformer

댓글 수 로딩 중

[논문리뷰] 2D Gaussian Splatting with Semantic Alignment for Image Inpainting

댓글 수 로딩 중

[논문리뷰] InfiGUI-G1: Advancing GUI Grounding with Adaptive Exploration Policy Optimization

댓글 수 로딩 중

[논문리뷰] UniME-V2: MLLM-as-a-Judge for Universal Multimodal Embedding Learning

댓글 수 로딩 중