#Feed-forward Network

2개의 포스트

[논문리뷰] 4DLangVGGT: 4D Language-Visual Geometry Grounded Transformer

기존 4D 시맨틱 필드 구축 방식이 Gaussian Splatting 에 의존하여 장면별 최적화가 필요하고 일반화 및 확장성이 제한적인 문제를 해결하고자 합니다.

#Review #4D Scene Understanding #Language Grounding #Transformer #Feed-forward Network #Semantic Field #Geometry Reconstruction #Embodied AI

2025년 12월 4일

[논문리뷰] Snap-Snap: Taking Two Images to Reconstruct 3D Human Gaussians in Milliseconds

본 연구는 극도로 희소한 입력(전면 및 후면 이미지 단 두 장)만으로 3D 인체 가우시안을 재구성하는 도전적인 문제를 해결하고자 합니다. 기존 방법론의 고비용 데이터 수집 및 긴 처리 시간의 한계를 극복하고, 사용자 친화적인 방식으로 디지털 휴먼 생성을 위한 문턱을 낮추는 것을 목표로 합니다.

#Review #3D Human Reconstruction #Gaussian Splatting #Sparse View #Two-Image Input #Real-time Inference #Point Cloud Prediction #Feed-forward Network

2025년 8월 22일