[논문리뷰] MIBURI: Towards Expressive Interactive Gesture Synthesis본 논문은 현재 대규모 언어 모델(LLM) 기반 대화형 에이전트가 부족한 신체 움직임 및 표현력 있는 제스처를 보완하고자 합니다.#Review#Embodied Conversational Agents#Gesture Synthesis#Real-time AI#Causal Models#Transformer Networks#Residual VQ-VAE#Speech-text Foundation Models2026년 3월 4일댓글 수 로딩 중
[논문리뷰] Representing Speech Through Autoregressive Prediction of Cochlear Tokens본 논문은 인간의 청각 처리 계층에서 영감을 받아, 유연하고 효율적으로 음성 정보를 이해하고 상호작용하는 인공 신경망 모델을 개발하는 것을 목표로 합니다.#Review#Speech Representation Learning#Autoregressive Models#Cochlear Tokens#Biologically Inspired AI#Self-Supervised Learning#Audio Processing#Transformer Networks2025년 8월 19일댓글 수 로딩 중
[논문리뷰] G-CUT3R: Guided 3D Reconstruction with Camera and Depth Prior Integration본 논문은 기존의 피드포워드(feed-forward) 3D 재구성 모델들이 RGB 이미지에만 의존하여 보조 데이터(깊이 맵, 카메라 내/외부 파라미터)를 활용하지 못하는 한계를 해결하고자 합니다.#Review#3D Reconstruction#Deep Learning#Multi-Modal Fusion#Camera Pose Estimation#Depth Estimation#Transformer Networks#Prior Information2025년 8월 19일댓글 수 로딩 중
[논문리뷰] ACE: Attribution-Controlled Knowledge Editing for Multi-hop Factual Recall대규모 언어 모델(LLMs)의 지식 편집(KE) 과정에서 다중 홉 사실 회상(multi-hop factual recall) 성능이 크게 저하되는 문제를 해결하고자 합니다.#Review#Knowledge Editing#LLMs#Multi-hop Reasoning#Mechanistic Interpretability#Neuron-level Attribution#Factual Recall#Transformer Networks2025년 10월 13일댓글 수 로딩 중