[논문리뷰] ReDirector: Creating Any-Length Video Retakes with Rotary Camera Encoding본 연구는 기존 비디오 리테이크 생성 방법론이 가변 길이 입력, 동적 카메라 모션, 분포 외 카메라 궤적에 취약하며, 종종 워핑 아티팩트나 흐릿한 객체를 생성하는 한계를 해결하고자 합니다.#Review#Video Retake Generation#Camera Control#Rotary Position Embedding (RoPE)#Rotary Camera Encoding (RoCE)#Geometric Consistency#Video Generative Models#Transformer Architecture#Multi-view Synthesis2025년 11월 25일댓글 수 로딩 중
[논문리뷰] SPATIALGEN: Layout-guided 3D Indoor Scene Generation고품질의 3D 실내 환경 모델을 생성하는 기존 방식의 시간 소모성 및 제한된 다양성 문제를 해결하고, 시각적 품질, 다양성, 의미론적 일관성 및 사용자 제어 사이의 균형을 맞추기 위한 연구입니다.#Review#3D Scene Generation#Layout Guidance#Diffusion Models#Multi-view Synthesis#Synthetic Dataset#Indoor Environments#Gaussian Splatting#Semantic Consistency2025년 9월 22일댓글 수 로딩 중
[논문리뷰] Droplet3D: Commonsense Priors from Videos Facilitate 3D Generation3D 데이터 부족 문제를 해결하기 위해 대규모 비디오 데이터에서 얻은 상식 사전(commonsense priors) 을 활용하여 3D 생성 모델의 일반화 능력을 향상시키는 것을 목표로 합니다.#Review#3D Generation#Video Diffusion Models#Spatial Consistency#Semantic Knowledge#Multi-view Synthesis#Large-scale Dataset#Image-to-3D#Text-to-3D2025년 9월 1일댓글 수 로딩 중
[논문리뷰] CharacterShot: Controllable and Consistent 4D Character Animation본 논문은 단일 캐릭터 이미지와 2D 포즈 시퀀스를 입력으로 받아, 사용자가 제어할 수 있는 동적인 3D 캐릭터(4D 캐릭터 애니메이션)를 생성하는 프레임워크인 CharacterShot 을 제안합니다.#Review#4D Character Animation#Diffusion Models#Gaussian Splatting#Pose Control#Multi-view Synthesis#Temporal Consistency#Character Dataset2025년 8월 13일댓글 수 로딩 중
[논문리뷰] WristWorld: Generating Wrist-Views via 4D World Models for Robotic Manipulation로봇 조작을 위한 VLA(Vision-Language-Action) 모델 은 미세한 손-객체 상호작용을 포착하는 손목 시점(wrist-view) 관찰에 크게 의존하지만, 대규모 데이터셋에서는 이러한 손목 시점 데이터가 부족합니다.#Review#4D World Models#Robotic Manipulation#Video Generation#Multi-view Synthesis#Visual-Language-Action (VLA)#Geometric Consistency#Diffusion Models#Wrist-View2025년 10월 9일댓글 수 로딩 중