#Speech Translation

4개의 포스트

[논문리뷰] OpenSTBench: Beyond Semantic Evaluation for Speech Translation

본 논문은 현대의 음성 번역 시스템이 S2TT, S2ST, 오프라인, 스트리밍 환경 등 다양한 시나리오로 확장됨에 따라 발생하는 평가의 불일치 문제를 해결하고자 한다.

#Review #Speech Translation #Evaluation Framework #S2ST #S2TT #Streaming #Multidimensional #Temporal Quality

2026년 6월 3일

[논문리뷰] OmniFusion: Simultaneous Multilingual Multimodal Translations via Modular Fusion

본 논문은 텍스트 전용 번역 LLM이 겪는 지연 시간과 멀티모달 컨텍스트 활용 불가능성, 그리고 MMFM이 가진 다국어 번역 성능 및 커버리지의 한계를 해결하고자 합니다.

#Review #Multimodal Translation #Speech Translation #Simultaneous Translation #Large Language Models #Multimodal Foundation Models #Modular Fusion #End-to-End #Gated Fusion #OCR

2025년 12월 1일

[논문리뷰] HI-TransPA: Hearing Impairments Translation Personal Assistant

본 논문은 청각 장애인이 일상적인 의사소통에서 겪는 어려움, 특히 불분명한 발화로 인한 문제를 해결하고자 합니다.

#Review #Multimodal AI #Hearing Impairment #Audio-Visual Speech Recognition #Curriculum Learning #Omni-Models #Assistive Technology #Lip Reading #Speech Translation

2025년 11월 16일

[논문리뷰] How to Evaluate Speech Translation with Source-Aware Neural MT Metrics

자동 음성-텍스트 번역(ST) 시스템 평가에서 텍스트 소스 가 없는 한계로 인해 소스 인식 신경 기계 번역(MT) 지표 를 적용하기 어렵습니다.

#Review #Speech Translation #Neural MT Metrics #Source-Aware Evaluation #Automatic Speech Recognition (ASR)#Back-Translation (BT)#Cross-lingual Re-segmentation #COMET #MetricX

2025년 11월 9일