Publications

CONFERENCE (DOMESTIC) 生成的言語モデルを用いた映画レビュー文からの細粒度な観点名の生成

石井 智大 (青学大), 莊司 慶行 (青学大), 山本 岳洋 (兵庫県立大), 大島 裕明 (兵庫県立大), 藤田 澄男

第15回データ工学と情報マネジメントに関するフォーラム(第21回日本データベース学会年次大会) (DEIM 2023)

April 25, 2023

本論文では,生成的言語モデルを用いて,あるレビュー文の言及する観点名(すなわち,その文が作品の どの側面に注目して書かれているか)を推定をする方法を提案する.具体的には,「宇宙空間での爆発がリアルだっ た。」という文から,「特撮技術」という観点名を生成する.このようレビュー文に観点名をつける場合,従来は事前に 人手で決めた観点に分類するか,観点名を抽出していた.一方で,映画レビューにおける観点は多様で,あらかじめ 列挙しきれないため,生成的言語モデルT5(Text-to-Text Transfer Transformer)を学習させ,文を入力すると観点 名を生成するようにした.この際,少ないデータで観点名を正しく生成可能にするため,ドメインデータによる追加 学習や,経由タスクによるファインチューニングを施した.こうした学習上の工夫の効果を検証するために,実際に Yahoo!映画のデータを用いて,評価実験を行った.生成された観点名の正しさ,多様さについて人手でラベル付けす ることで,提案手法は少量の学習データから細粒度な観点を正しく多様に生成できることが分かった.

Paper : 生成的言語モデルを用いた映画レビュー文からの細粒度な観点名の生成 (external link)