[논문리뷰] Focal Guidance: Unlocking Controllability from Semantic-Weak Layers in Video Diffusion Models본 논문은 Diffusion Transformer (DiT) 기반의 Image-to-Video (I2V) 모델에서 텍스트 프롬프트에 대한 제어력 부족 문제를 해결하고자 합니다.#Review#Video Diffusion Models#Image-to-Video Generation#Diffusion Transformers (DiT)#Controllability#Semantic Alignment#Focal Guidance#Prompt Adherence2026년 1월 14일댓글 수 로딩 중