訳語対の推定と順序入れ替え操作による説明可能なEnd-to-end音声翻訳 - Yahoo! JAPAN R&D

Publications

CONFERENCE (DOMESTIC) 訳語対の推定と順序入れ替え操作による説明可能なEnd-to-end音声翻訳

大町基, Brian Yan (Carnegie Mellon University), Siddharth Dalmia (Carnegie Mellon University), 藤田悠哉, 渡部晋治 (Carnegie Mellon University)

日本音響学会2023年春季研究発表会 (音響学会)

March 22, 2023

音声翻訳（ST）の代表的な手法として、End-to-end音声翻訳（E2E-ST）が提案されている。E2E-STシステムの構築においては、出力される翻訳文の品質に加えて、音声から翻訳文を生成するまでの過程の説明可能性を考慮することが望ましい。そこで本研究では、E2E-STモデルで原言語単語と目的言語単語のペア（訳語対）と目的言語単語の順序入れ替え操作で構成される系列を推定し、書き起こしと翻訳文を生成する枠組みを提案する。英語-ドイツ語および英語-フランス語の音声翻訳実験をおこない、提案法が説明可能な音声翻訳を実現し、既存のE2E-STに近い品質の翻訳文を生成できることを確認した。さらに、ストリーミング処理において、提案法が理にかなった翻訳文を生成できることも確認した。

Speech Processing