News

弊社のインターンの研究成果が、EMNLP Findings及びCoNLLに採択されました。

2022-11-07

弊社のインターンシップを通じた研究成果が、自然言語処理の国際会議CoNLLとEMNLP Findingsに採択されました。

1) Entity Embedding Completion for Wide-Coverage Entity Disambiguation

Daisuke Oba, Ikuya Yamada, Naoki Yoshinaga, Masashi Toyoda

EMNLP 2022 Findings (long paper)に採択されました。

エンティティリンキングでは、候補エンティティの埋め込みを参照する機構をモデルに備え、同時に最適化することが有効であると知られています。本研究では、説明文や言及文からエンティティの埋め込みを推定することで、学習済みモデルが扱うことのできる候補エンティティ集合を柔軟に拡張する手法STEELを提案しています。実験では、提案手法により推定された埋め込みが、事前に最適化されたものと同等の品質を持つことを示しました。

2) A Multilingual Bag-of-Entities Model for Zero-Shot Cross-Lingual Text Classification

Sosuke Nishikawa, Ikuya Yamada, Yoshimasa Tsuruoka, Isao Echizen

CoNLL 2022(long paper)に採択されました。

本研究では、テキスト中から言語に非依存なWikidataエンティティを抽出し、特徴量として多言語ニューラルネットワークモデルに組み込む手法を提案しています。多言語BERTや多言語RoBERTaなどの既存手法と比較し、言語間テキスト分類タスクで大幅な性能向上を達成しました。

https://arxiv.org/abs/2110.07792