Publications

カンファレンス (国内) 新旧のタグなしコーパスを用いた新エンティティ収集の評価

井上裁都、粟村誉、長田誠也、立石健二、宮崎林太郎、山下達雄

言語処理学会第24回年次大会 (NLP2018)

2018.3.26

一般にEntity Linkingの研究は,固定の知識ベース(辞書)とタグ付きコーパスを使った評価を前提とすることが多い.しかし,実世界への応用においては,辞書を常に新しい状態にすることはもちろん,更新した辞書の品質を評価できることが重要になる.とはいえ,更新した辞書の品質評価は,コストの観点で容易ではない.新しい辞書を定量的に評価するには,辞書中の新しいエンティティを含む新しいタグ付きコーパスが必要になる.本論文では,コスト削減のため,新しい辞書をタグなしコーパスを用いて評価する手法を提案する.提案手法は,新旧の辞書を使って新旧のコーパスを解析し,その結果の差分を分析することで評価する.

Paper : 新旧のタグなしコーパスを用いた新エンティティ収集の評価 (外部サイト)