[논문리뷰] Where Should Diffusion Enter a Language Model? Geometry-Guided Hidden-State Replacement본 논문은 기존의 연속적 diffusion 언어 모델이 오토레그레시브 Transformer보다 성능이 뒤처지는 문제를 해결하고자 한다. 기존 연구들은 주로 토큰 수준의 확산이나 복잡한 continuous-to-discrete recovery 과정에서 발생하는 오차를 한계로 지적한다.#Review#Diffusion-Transformer Hybrid#Hidden-State Reconstruction#Geometry-Guided#Diffusion-Friendly#Representation Geometry#Locate-and-Replace2026년 5월 18일댓글 수 로딩 중
[논문리뷰] SeGPruner: Semantic-Geometric Visual Token Pruner for 3D Question AnsweringVision-language models (VLMs)를 3D Question Answering (3D QA)에 적용할 때, 다중 뷰 이미지에서 발생하는 극심한 시각적 중복(token redundancy) 문제가 주요 장애물로 작용합니다.#Review#3D Question Answering#Vision-Language Models#Visual Token Pruning#Semantic-Awareness#Geometry-Guided2026년 3월 31일댓글 수 로딩 중