#Discrete Lip Semantics

1개의 포스트

[논문리뷰] Efficient Audio-Visual Speech Separation with Discrete Lip Semantics and Multi-Scale Global-Local Attention

오디오-비주얼 음성 분리(AVSS) 분야에서 기존 모델들의 높은 연산 비용과 파라미터 수로 인해 발생하는 실용적 배포의 한계를 해결하는 것을 목표로 합니다.

#Review #Audio-Visual Speech Separation #Deep Learning #Efficiency #Discrete Lip Semantics #Global-Local Attention #Lightweight Models #VQ-VAE

2025년 10월 1일