詳細 * リリース・ダウンロード * 参考文献 * 関連プロジェクト * English
国立研究開発法人情報通信研究機構(NICT)では、大規模かつどなたでもご入手いただける日本語の意味辞書を開発することを目的とし、 2006年から日本語ワードネットの開発を進めて参りました。その後2009年2月に 日本語ワードネット0.9版 をまず公開いたしました。 日本語ワードネットは、プリンストン大学で開発された Princeton WordNet やPrinceton WordNetとヨーロッパのEuroWordNet協会が推進す るGlobal WordNet Gridに 着想を得て開発されました。 ライセンスを保持していただければ、基本的に日本語ワードネットは無償で使用、複写、改変、頒布していただけます。 詳細はライセンスをご参照下さい。
現在、広く利用されているPrinceton WordNetは、語を類義関係のセット (synset)でグループ化している点に特徴があり、一つのsynsetが一つの概念に対 応します。また、各synsetは上位下位関係などの多様な関係で 結ばれています。現在、世界的にも各国言語のワードネットが作られ、言語処理 研究や言語学研究などに広く利用されております。 Princeton WordNetに関する詳細な説明は、こちらをご覧ください。
日本語ワードネットでは、Princeton WordNetのsynsetに対応して日本語が付与されています。 しかし、まだPrinceton WordNetには存在しない日本語synsetを付与する必要が あり、また、Princeton WordNetのsynsetの階層構造を日本語シソーラスとして 利用するためには、現状のsynsetを修正する必要もあります。これらのタスクは 今後のリリース版で実現していく予定です。
このリリース版は、Wn-Ja 1.1です。全ての関係(上位語、全体部分関係 など)はPrinceton WordNet 3.0に準じています。改訂版は、本ホームページに随時アップロードいたします。
日本語ワードネットに収録されたsynset数や単語数、語義数は次のとおりです。
是非、日本語ワードネットをご利用くださり、みなさまのいろいろなご活動にお役立てください。 これを利用した研究成果をご発表になる際は、 参考文献に掲載しました論文のうち少なくとも一つを引用していただきますようお願いいたします。 また、ご質問やコメントなどがございましたら jwordnet@gmail.com までご連絡ください。 エラーに関するフィードバックも頂けましたら幸いです。
注:: このリリース版では、全エントリーのうちの5%ほどがエラー と考えられます。これは細かくチェックするより、まずはなるべく広くカバー することに力を注いだためです。今後は意味タグ付きテ キストを翻訳する予定ですので、その過程で構築時には見落としていたエラーを発見・訂正していきたいと考えております。
また、日本語ワードネットはこちらのウェブページでも利用されています。
Natural Language Processing with Python (Bird, Klein and Loper, 2009) の日本語版 入門 自然言語処理 の12.1.5節 日本語WordNetにも利用されています。