[논문리뷰] Video2LoRA: Parametric Video Internalization for Vision-Language Models본 논문은 기존 VLM 기반 비디오 이해 모델들이 겪는 고질적인 컨텍스트 윈도우 병목 현상과 과도한 토큰 소비 문제를 해결하고자 합니다. 기존 방식은 프레임별로 수백 개의 시각 토큰을 컨텍스트에 삽입해야 하므로, 영상 길이가 길어지거나 질의가 반복될 때마다 메모리와 Latency 부담이 기하급수적으로 증가합니다 .#Review#Video-Language Models#Low-Rank Adaptation#Hypernetwork#Video Internalization#Inference Efficiency#Parametric Knowledge Compression#Perceiver2026년 6월 4일댓글 수 로딩 중
[논문리뷰] Scaling DoRA: High-Rank Adaptation via Factored Norms and Fused Kernels기존의 Weight-Decomposed Low-Rank Adaptation (DoRA) 구현은 특히 high-rank 설정에서 심각한 메모리 및 성능 병목 현상을 겪습니다.#Review#DoRA#Low-Rank Adaptation#Parameter-Efficient Fine-Tuning#Fused Kernels#Memory Optimization#Performance Scaling#Triton2026년 3월 23일댓글 수 로딩 중
[논문리뷰] SliderEdit: Continuous Image Editing with Fine-Grained Instruction Control기존 instruction-based image editing 모델들이 고정된 강도로 편집을 적용하여 개별 편집에 대한 정밀하고 연속적인 제어가 불가능하다는 한계를 해결하고자 합니다.#Review#Image Editing#Continuous Control#Fine-Grained Control#Instruction-based#Low-Rank Adaptation#Disentanglement#Generative Models2025년 11월 13일댓글 수 로딩 중
[논문리뷰] LuxDiT: Lighting Estimation with Video Diffusion Transformer논문은 단일 이미지 또는 비디오로부터 고품질의 HDR 환경 맵 을 추정하는 오랜 난제를 해결하고자 합니다. 이는 실측 HDR 환경 맵의 희소성, 간접 시각 단서에 대한 의존성, 전역적 컨텍스트 추론 및 고동적 범위(HDR) 출력 복구의 어려움으로 인해 발생합니다.#Review#Lighting Estimation#HDR Environment Map#Diffusion Models#Video Transformer#Low-Rank Adaptation#Generative Models#Synthetic Data2025년 9월 8일댓글 수 로딩 중
[논문리뷰] ToonComposer: Streamlining Cartoon Production with Generative Post-Keyframing이 논문은 전통적인 카툰 제작 파이프라인의 핵심적인 병목 현상인 인비트위닝(inbetweening) 과 컬러라이제이션(colorization) 단계의 수동적인 노력과 오류 누적 문제를 해결하는 것을 목표로 합니다.#Review#Cartoon Generation#Video Diffusion Models#DiT#Post-Keyframing#Low-Rank Adaptation#Sparse Control#Generative AI#Animation2025년 8월 15일댓글 수 로딩 중