Yahoo! JAPANの研究開発

JP
EN

People

藤田悠哉 Yuya Fujita ソフトウェアエンジニア

音声処理

音声認識技術の研究開発に携わっております。

Publications

その他 (国際)

Toward Streaming ASR with Non-Autoregressive Insertion-based Model

Yuya Fujita, Tianzi Wang (Johns Hopkins Univ.), Shinji Watanabe (Carnegie Mellon Univ.), Motoi Omachi

arXiv.org

2021.7.16
カンファレンス (国際)

End-to-end ASR to jointly predict transcriptions and linguistic annotations

Motoi Omachi, Yuya Fujita, Shinji Watanabe (Johns Hopkins University), Matthew Wiesner (Johns Hopkins University)

The 2021　North American Chapter of the Association for Computational Linguistics : Human Language Technologies

2021.6.6
カンファレンス (国内)

挿入操作に基づく End-to-End モデルによる音声認識と音声区間検出

藤田悠哉, 渡部晋治 (Johns Hopkins Univ.), 大町基

日本音響学会2021年春季研究発表会

2021.3.10
その他 (国際)

End-to-End ASR and Audio Segmentation with Non-autoregressive Insertion-based model

Yuya Fujita, Shinji Watanabe (Johns Hopkins Univ.), Motoi Omachi

arXiv.org

2020.12.18
カンファレンス (国際)

End-to-End ASR with Adaptive Span Self-Attention

Xuankai Chang (Johns Hopkins University), Aswin Shanmugam Subramanian (Johns Hopkins University), Pengcheng Guo (Northwestern Polytechnical University, Johns Hopkins University), Shinji Watanabe (Johns Hopkins University), Yuya Fujita, Motoi Omachi

INTERSPEECH 2020

2020.10.25
カンファレンス (国際)

Insertion-Based Modeling for End-to-End Automatic Speech Recognition

Yuya Fujita, Shinji Watanabe (Johns Hopkins University), Motoi Omachi, Xuankai Chang (Johns Hopkins University)

INTERSPEECH 2020

2020.10.25
カンファレンス (国内)

単語の表記と素性を同時出力するend-to-end音声認識

大町基, 藤田悠哉, 渡部晋治 (Johns Hopkins University), Xuankai Chang (Johns Hopkins University)

日本音響学会2020年秋季研究発表会

2020.9.11
カンファレンス (国内)

挿入操作に基づく End-to-End 音声認識

藤田悠哉, 渡部晋治 (Johns Hopkins Univ.), 大町基, Xuankai Chang (Johns Hopkins Univ.)

日本音響学会2020年秋季研究発表会

2020.9.9
その他 (国際)

Insertion-Based Modeling for End-to-End Automatic Speech Recognition

Yuya Fujita, Shinji Watanabe (Johns Hopkins University), Motoi Omachi, Xuankai Chang (Johns Hopkins University)

arXiv.org

2020.5.27
カンファレンス (国際)

Attention-based ASR with Lightweight and Dynamic Convolutions

Yuya Fujita, Aswin Shanmugam Subramanian (Johns Hopkins University), Motoi Omachi, Shinji Watanabe (Johns Hopkins University)

45th International Conference on Acoustics, Speech, and Signal Processing

2020.5.8
カンファレンス (国内)

軽量・動的畳み込みを用いたend-to-end音声認識

藤田悠哉, Aswin Shanmugam Subramanian*, 大町基, 渡部晋治* (* Johns Hopkins University)

日本音響学会2020年春季研究発表会

2020.3.9
その他 (国際)

Attention-based ASR with Lightweight and Dynamic Convolutions

Yuya Fujita, Aswin Shanmugam Subramanian (Johns Hopkins University), Motoi Omachi, Shinji Watanabe (Johns Hopkins University)

arXiv.org

2020.2.20
ワークショップ (国際)

Generalized Weighted-Prediction-Error Dereverberation with Varying Source Priors for Reverberant Speech Recognition

Toru Taniguchi, Aswin Shanmugam Subramanian (Johns Hopkins Univ.), Xiaofei Wang (Johns Hopkins Univ.), Dung Tran, Yuya Fujita, and Shinji Watanabe(Johns Hopkins Univ.)

2019 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics

2019.10.20
ワークショップ (国際)

Speech Enhancement Using End-to-End Speech Recognition Objectives

Aswin Shanmugam Subramanian(Johns Hopkins University), Xiaofei Wang (Johns Hopkins Univ.), Shinji Watanabe (Johns Hopkins Univ.), Murali Karthick Baskar (Johns Hopkins Univ., Brno University of Technology), Toru Taniguchi, Dung Tran, and Yuya Fujita

2019 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics

2019.10.20
その他 (国際)

An Investigation of End-to-End Multichannel Speech Recognition for Reverberant and Mismatch Conditions

Aswin Shanmugam Subramanian (Johns Hopkins Univ.), Xiaofei Wang (Johns Hopkins Univ.), Shinji Watanabe (Johns Hopkins Univ.), Toru Taniguchi, Dung Tran, Yuya Fujita

arXiv.org

2019.4.28
論文誌 (国内)

Web検索等に利用される分散型音声認識システムへのディープラーニングの実装

藤田悠哉

情報処理学会デジタルプラクティス Vol.10 No.2(Apr. 2019)

2019.4.15
ワークショップ (国際)

Speaker Selective Beamformer with Keyword Mask Estimation

Yusuke Kida, Dung Tran, Motoi Omachi, Toru Taniguchi, and Yuya Fujita

2018 IEEE Workshop on Spoken Language Technology

2018.12.18
論文誌 (国際)

Speaker Selective Beamformer with Keyword Mask Estimation

Yusuke Kida, Dung Tran, Motoi Omachi, Toru Taniguchi, Yuya Fujita

arXiv.org

2018.10.26
カンファレンス (国内)

Wakeupワードに特化したDNNマスクを用いた背景発話に頑健な音声認識

木田祐介、Dung Tran、大町基、谷口徹、藤田悠哉

日本音響学会2018年秋季研究発表会

2018.9.12
カンファレンス (国際)

Multi Scale Feedback Connection for Noise Robust Acoustic Modeling

Dung Tran, Ken-ichi Iso, Motoi Omachi, Yuya Fujita

2018 IEEE International Conference on Acoustics, Speech and Signal Processing

2018.4.15

前へ

前のページ

1
2
3

次のページ

次へ