[논문리뷰] Video2LoRA: Parametric Video Internalization for Vision-Language Models본 논문은 기존 VLM 기반 비디오 이해 모델들이 겪는 고질적인 컨텍스트 윈도우 병목 현상과 과도한 토큰 소비 문제를 해결하고자 합니다. 기존 방식은 프레임별로 수백 개의 시각 토큰을 컨텍스트에 삽입해야 하므로, 영상 길이가 길어지거나 질의가 반복될 때마다 메모리와 Latency 부담이 기하급수적으로 증가합니다 .#Review#Video-Language Models#Low-Rank Adaptation#Hypernetwork#Video Internalization#Inference Efficiency#Parametric Knowledge Compression#Perceiver2026년 6월 4일댓글 수 로딩 중
[논문리뷰] TC-LoRA: Temporally Modulated Conditional LoRA for Adaptive Diffusion Control기존의 controllable diffusion model이 고정된 아키텍처와 정적인 컨디셔닝 전략을 사용하여 동적인 denoising 과정에 비효율적이라는 문제를 해결합니다.#Review#Diffusion Models#Conditional Generation#LoRA#Hypernetwork#Dynamic Weight Adaptation#Generative AI#Controllable Generation2025년 10월 13일댓글 수 로딩 중