#Low-Resource Speech

1개의 포스트

[논문리뷰] POWSM: A Phonetic Open Whisper-Style Speech Foundation Model

본 논문은 자동 음성 인식(ASR), 음소 인식(PR), 철자-음소 변환(G2P), 음소-철자 변환(P2G)과 같은 개별적으로 연구되어온 음소 관련 태스크들을 단일의 통합 프레임워크 에서 수행하는 것을 목표로 합니다.

#Review #Phonetic Foundation Model #Multitask Learning #Speech Recognition #Phone Recognition #Grapheme-to-Phoneme #Encoder-Decoder #Low-Resource Speech

2025년 10월 31일