News
トークナイザとしてWordPieceを採用した日本語LUKEをユーザベースと開発
News
2023-09-12
株式会社ユーザベースとの業務提携の一環として、「ニューステキスト内の企業名抽出」の課題を解決するため、日本語LUKEをベースとしたモデルを開発し、公開いたしました。
日本語LUKEはトークナイザとしてSentencepieceを使っていますが、これをWordPieceに変更することで、従来の日本語LUKEと比較してNER等の情報抽出系タスクに適したモデルとなっています。
詳細につきましては、ユーザベースのテックブログをご参照下さい。