[논문리뷰] Q-Zoom: Query-Aware Adaptive Perception for Efficient Multimodal Large Language Models본 논문은 Q-Zoom이라는 2단계 적응형 프레임워크를 통해 시각적 인지 효율성을 개선한다. 첫 번째 단계인 Dynamic Gating Network는 consistency-aware 훈련 전략을 통해 고해상도 처리가 불필요한 쿼리를 식별하여 우회함으로써 불필요한 계산을 줄인다.#Review#Multimodal Large Language Models#Efficient Perception#Dynamic Gating#Region Proposal Network#Self-Distillation#High-Resolution Adaptation2026년 4월 8일댓글 수 로딩 중