#Transformer Networks

4개의 포스트

[논문리뷰] MIBURI: Towards Expressive Interactive Gesture Synthesis

본 논문은 현재 대규모 언어 모델(LLM) 기반 대화형 에이전트가 부족한 신체 움직임 및 표현력 있는 제스처를 보완하고자 합니다.

#Review #Embodied Conversational Agents #Gesture Synthesis #Real-time AI #Causal Models #Transformer Networks #Residual VQ-VAE #Speech-text Foundation Models

2026년 3월 4일

[논문리뷰] Representing Speech Through Autoregressive Prediction of Cochlear Tokens

본 논문은 인간의 청각 처리 계층에서 영감을 받아, 유연하고 효율적으로 음성 정보를 이해하고 상호작용하는 인공 신경망 모델을 개발하는 것을 목표로 합니다.

#Review #Speech Representation Learning #Autoregressive Models #Cochlear Tokens #Biologically Inspired AI #Self-Supervised Learning #Audio Processing #Transformer Networks

2025년 8월 19일

[논문리뷰] G-CUT3R: Guided 3D Reconstruction with Camera and Depth Prior Integration

본 논문은 기존의 피드포워드(feed-forward) 3D 재구성 모델들이 RGB 이미지에만 의존하여 보조 데이터(깊이 맵, 카메라 내/외부 파라미터)를 활용하지 못하는 한계를 해결하고자 합니다.

#Review #3D Reconstruction #Deep Learning #Multi-Modal Fusion #Camera Pose Estimation #Depth Estimation #Transformer Networks #Prior Information

2025년 8월 19일

[논문리뷰] ACE: Attribution-Controlled Knowledge Editing for Multi-hop Factual Recall

대규모 언어 모델(LLMs)의 지식 편집(KE) 과정에서 다중 홉 사실 회상(multi-hop factual recall) 성능이 크게 저하되는 문제를 해결하고자 합니다.

#Review #Knowledge Editing #LLMs #Multi-hop Reasoning #Mechanistic Interpretability #Neuron-level Attribution #Factual Recall #Transformer Networks

2025년 10월 13일