Publications

CONFERENCE (DOMESTIC) 検索クエリにおける共起情報を活用した非曖昧ドメイン固有語の抽出: ランドマークの事例

西川 荘介, 山城 颯太, 浅野 広樹, 佐野 峻平, 颯々野 学

言語処理学会第29回年次大会 (NLP2023)

March 15, 2023

特定ドメインにおける曖昧性のない固有名詞(非曖昧ドメイン固有語)は固有表現抽出に有用である. 本稿では非曖昧ドメイン固有語辞書構築の一例として,地図上の一点を表す拠点名称以外の意味ではほぼ出現しない語(非曖昧ランドマーク語)の辞書を自動構築した取り組みについて記述する. 提案手法ではこの問題を,エンティティ名が非曖昧ランドマーク語であるか否かの二値分類タスクとして扱い, 検索クエリにおける共起語を活用することでランドマーク意図の強弱を考慮したモデルを提案する. 実験では提案モデルで0.907のF1値を達成し,ルールベースやその他の機械学習モデルよりも高い性能を示した. さらに,提案モデルを用いた辞書自動構築により,固有表現抽出システムの改善を確認した.