音声処理
-
- カンファレンス (国内)
- 挿入操作に基づく End-to-End モデルによる音声認識と音声区間検出
- 藤田 悠哉, 渡部 晋治 (Johns Hopkins Univ.), 大町 基
- 日本音響学会2021年春季研究発表会
- 2021.3.10
-
- その他 (国際)
- End-to-End ASR and Audio Segmentation with Non-autoregressive Insertion-based model
- Yuya Fujita, Shinji Watanabe (Johns Hopkins Univ.), Motoi Omachi
- arXiv.org
- 2020.12.18
-
- 論文誌 (国際)
- Innovation, Standardization, and Business Success in Media Signal Processing
- Akihiko Sugiyama and Masahiro Serizawa (NEC Corporation)
- Institute of Electrical and Electronics Engineers, Consumer Electronics Magazine (MCE)
- 2020.11.3
-
- カンファレンス (国際)
- End-to-End ASR with Adaptive Span Self-Attention
- Xuankai Chang (Johns Hopkins University), Aswin Shanmugam Subramanian (Johns Hopkins University), Pengcheng Guo (Northwestern Polytechnical University, Johns Hopkins University), Shinji Watanabe (Johns Hopkins University), Yuya Fujita, Motoi Omachi
- INTERSPEECH 2020
- 2020.10.25
-
- カンファレンス (国際)
- Insertion-Based Modeling for End-to-End Automatic Speech Recognition
- Yuya Fujita, Shinji Watanabe (Johns Hopkins University), Motoi Omachi, Xuankai Chang (Johns Hopkins University)
- INTERSPEECH 2020
- 2020.10.25
-
- カンファレンス (国内)
- 単語の表記と素性を同時出力するend-to-end音声認識
- 大町 基, 藤田 悠哉, 渡部 晋治 (Johns Hopkins University), Xuankai Chang (Johns Hopkins University)
- 日本音響学会2020年秋季研究発表会 (音響学会)
- 2020.9.11
-
- カンファレンス (国内)
- 挿入操作に基づく End-to-End 音声認識
- 藤田 悠哉, 渡部 晋治 (Johns Hopkins Univ.), 大町 基, Xuankai Chang (Johns Hopkins Univ.)
- 日本音響学会2020年秋季研究発表会 (音響学会)
- 2020.9.9
-
- その他 (国際)
- Insertion-Based Modeling for End-to-End Automatic Speech Recognition
- Yuya Fujita, Shinji Watanabe (Johns Hopkins University), Motoi Omachi, Xuankai Chang (Johns Hopkins University)
- arXiv.org
- 2020.5.27
-
- カンファレンス (国際)
- Attention-based ASR with Lightweight and Dynamic Convolutions
- Yuya Fujita, Aswin Shanmugam Subramanian (Johns Hopkins University), Motoi Omachi, Shinji Watanabe (Johns Hopkins University)
- 45th International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2020)
- 2020.5.8
-
- カンファレンス (国際)
- Fast Start-Up Algorithm for Adaptive Noise Cancellers with Novel SNR Estimation and Stepsize Control
- Akihiko Sugiyama
- International Conference on Acoustics, Speech, and Signal Processing 2020 (ICASSP2020)
- 2020.5.4
-
- カンファレンス (国内)
- 軽量・動的畳み込みを用いたend-to-end音声認識
- 藤田 悠哉, Aswin Shanmugam Subramanian*, 大町 基, 渡部晋治* (* Johns Hopkins University)
- 日本音響学会2020年春季研究発表会 (音響学会)
- 2020.3.9
-
- その他 (国際)
- Attention-based ASR with Lightweight and Dynamic Convolutions
- Yuya Fujita, Aswin Shanmugam Subramanian (Johns Hopkins University), Motoi Omachi, Shinji Watanabe (Johns Hopkins University)
- arXiv.org
- 2020.2.20
-
- カンファレンス (国際)
- Fast Convergence Algorithm for Adaptive Noise Cancellers with SNR-Based Stepsize Control
- Akihiko Sugiyama
- International Conference on Consumer Electronics 2020 (ICCE2020)
- 2020.1.4
-
- ワークショップ (国際)
- Generalized Weighted-Prediction-Error Dereverberation with Varying Source Priors for Reverberant Speech Recognition
- Toru Taniguchi, Aswin Shanmugam Subramanian (Johns Hopkins Univ.), Xiaofei Wang (Johns Hopkins Univ.), Dung Tran, Yuya Fujita, and Shinji Watanabe(Johns Hopkins Univ.)
- 2019 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA 2019)
- 2019.10.20
-
- ワークショップ (国際)
- Speech Enhancement Using End-to-End Speech Recognition Objectives
- Aswin Shanmugam Subramanian(Johns Hopkins University), Xiaofei Wang (Johns Hopkins Univ.), Shinji Watanabe (Johns Hopkins Univ.), Murali Karthick Baskar (Johns Hopkins Univ., Brno University of Technology), Toru Taniguchi, Dung Tran, and Yuya Fujita
- 2019 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA 2019)
- 2019.10.20
-
- カンファレンス (国際)
- Simultaneous Detection and Localization of a Wake-Up Word using Multi-Task Learning of the Duration and Endpoint
- Takashi Maekaku, Yusuke Kida, Akihiko Sugiyama
- The 20th Annual Conference of the International Speech Communication Association (INTERSPEECH 2019)
- 2019.9.19
-
- カンファレンス (国内)
- 国際会議ICASSP2019報告
- 秋田 祐哉*1,大町 基,岡本 拓磨*2,落合 翼*3,小川 厚徳*3,神田 直之*4,郡山 知樹*5,鈴木 雅之*6,太刀 岡勇気*7,俵 直弘*3,増村 亮*3,渡部 晋治*8 *1 京大、*2 NICT、*3 NTT、*4 日立、*5 東大、*6 IBM、*7 デンソーアイティーラボラトリ、*8 JHU
- 情報処理学会 第128回音声言語情報処理研究発表会
- 2019.7.12
-
- その他 (国際)
- An Investigation of End-to-End Multichannel Speech Recognition for Reverberant and Mismatch Conditions
- Aswin Shanmugam Subramanian (Johns Hopkins Univ.), Xiaofei Wang (Johns Hopkins Univ.), Shinji Watanabe (Johns Hopkins Univ.), Toru Taniguchi, Dung Tran, Yuya Fujita
- arXiv.org
- 2019.4.28
-
- 論文誌 (国内)
- Web検索等に利用される分散型音声認識システムへのディープラーニングの実装
- 藤田 悠哉
- 情報処理学会 デジタルプラクティス Vol.10 No.2(Apr. 2019)
- 2019.4.15
-
- カンファレンス (国内)
- Model Averaging法を用いた音声認識のためのマルチGPU学習の高速化
- 吉澤 風希(東大)、磯 健一
- 日本音響学会2019年春季研究発表会
- 2019.3.5