複数エンコーダを用いたヤフートピックス見出し候補生成 - Yahoo! JAPANの研究開発

Publications

カンファレンス (国内) 複数エンコーダを用いたヤフートピックス見出し候補生成

小林健、小林隼人、村尾一真、増山毅司

言語処理学会第24回年次大会 (NLP2018)

2018.3.26

スマートデバイスの普及に伴い，コンテンツを閲覧するデバイスはPCからスマートフォン等に移り変わってきている．しかし，これらのデバイスのディスプレイのサイズはPCと比較して小さく，ユーザーが様々なコンテンツを視認するために，コンテンツのタイトルを一定の長さ以内に抑える技術が求められている．一方で，日々のニュースをピックアップするYahoo!ニュース・トピックスでは，Yahoo! JAPANのトップページの表示領域に合わせて，トピックスページのタイトル（トピックス見出し）を編集者の手によって全角文字を1文字，半角文字を0.5文字とした，合計13.5文字に収まるように作成してきた．そこで，編集者によるトピックス見出しの作成作業を何らかの方法によって学習することができれば，限られた文字数でニュースの要点を押さえたタイトルの生成が可能になると考える．本研究では，記事のタイトルとリード文を組み合わせて利用した見出し生成手法を提案し，タイトルのみを利用した見出し生成手法よりも品質の良い見出しを生成することができた．

自然言語処理

Paper : 複数エンコーダを用いたヤフートピックス見出し候補生成（外部サイト）