[논문리뷰] OpenSTBench: Beyond Semantic Evaluation for Speech Translation본 논문은 현대의 음성 번역 시스템이 S2TT, S2ST, 오프라인, 스트리밍 환경 등 다양한 시나리오로 확장됨에 따라 발생하는 평가의 불일치 문제를 해결하고자 한다.#Review#Speech Translation#Evaluation Framework#S2ST#S2TT#Streaming#Multidimensional#Temporal Quality2026년 6월 3일댓글 수 로딩 중
[논문리뷰] OmniFusion: Simultaneous Multilingual Multimodal Translations via Modular Fusion본 논문은 텍스트 전용 번역 LLM이 겪는 지연 시간과 멀티모달 컨텍스트 활용 불가능성, 그리고 MMFM이 가진 다국어 번역 성능 및 커버리지의 한계를 해결하고자 합니다.#Review#Multimodal Translation#Speech Translation#Simultaneous Translation#Large Language Models#Multimodal Foundation Models#Modular Fusion#End-to-End#Gated Fusion#OCR2025년 12월 1일댓글 수 로딩 중
[논문리뷰] HI-TransPA: Hearing Impairments Translation Personal Assistant본 논문은 청각 장애인이 일상적인 의사소통에서 겪는 어려움, 특히 불분명한 발화로 인한 문제를 해결하고자 합니다.#Review#Multimodal AI#Hearing Impairment#Audio-Visual Speech Recognition#Curriculum Learning#Omni-Models#Assistive Technology#Lip Reading#Speech Translation2025년 11월 16일댓글 수 로딩 중
[논문리뷰] How to Evaluate Speech Translation with Source-Aware Neural MT Metrics자동 음성-텍스트 번역(ST) 시스템 평가에서 텍스트 소스 가 없는 한계로 인해 소스 인식 신경 기계 번역(MT) 지표 를 적용하기 어렵습니다.#Review#Speech Translation#Neural MT Metrics#Source-Aware Evaluation#Automatic Speech Recognition (ASR)#Back-Translation (BT)#Cross-lingual Re-segmentation#COMET#MetricX2025년 11월 9일댓글 수 로딩 중