[논문리뷰] ResAdapt: Adaptive Resolution for Efficient Multimodal Reasoning최근의 MLLMs 는 입력 정보의 정밀도(fidelity)를 높여 성능을 향상시키지만, 이는 과도한 visual token의 증가로 이어져 고해상도와 긴 시간적 맥락(long temporal context)을 동시에 유지하는 것을 불가능하게 만듭니다.#Review#Multimodal Large Language Models (MLLMs)#Input-side Adaptation#Contextual Bandit#Cost-Aware Policy Optimization (CAPO)#Visual Budgeting#Efficient Inference#Temporal Reasoning2026년 3월 30일댓글 수 로딩 중