日本語 WordNet

概要 * リリース・ダウンロード * 参考文献 * 関連プロジェクト * English

日本語ワードネットとは?

日本語ワードネットは日本語の概念辞書です。個々の概念はそれぞれ「synset」という単位にまとめられており、それらが他のsynsetと意味的に結びついています。
本辞書は、英語ワードネットをもとに構築されました。

検索について

左フレームの「WordNet 検索」からお試しいただけます。

日本語or英語から検索

「Lookup Word (or Synset)」ウィンドウに単語を入力し、「Language」で言語を選択して「Search WN」を押してください。
検索結果から該当するsynset offsetのリンクをクリックすると、synsetの内容が表示されます。
注) 英語から検索される場合、大文字ではhitしませんので、固有名を検索する際であっても必ず全て小文字でご入力ください。

synset offset(synset番号、後述)から検索

言語の選択は必要ありません。「Lookup Word (or Synset)」ウィンドウに番号を入力し、そのまま「Search WN」を押してください。

スクリーンショット

screenshot

1 synset番号(synset offset)

「8ケタの数字+"-(半角ハイフン)"+アルファベット」で表されています。アルファベットは品詞を表していて、それぞれ


を表しています。 品詞についてのもう少し具体的な内容説明はこちらの節で行います。以下、「8ケタの数字+"-(半角ハイフン)"+アルファベット」は、全てsynset番号を表します。

2 同義語(synonym)

その概念を言い表すのに使用される語です。英語のものは英語ワードネットのもので、日本語のものは複数の他言語ワードネットと対日辞書を用いて作成しました。その後ある程度までは人手で修正しましたが、まだチェックしきれていないものも残っており、誤りが含まれている、あるいは含まれるべきものが含まれていないという場合もございます。 同義語の扱いについての詳しい話はこちら

3 定義文・例文(gloss)

英文は英語ワードネットのもので、日本語は当方で翻訳したものです。そのsynsetの意味するところがダイレクトに伝わりやすいように、翻訳の際は意訳をなるべく避けました。専門用語や日本語スピーカーにとって馴染みの薄い概念は訳しづらく、誤りが多少含まれている場合もあります。また、まずは全てのsynsetに日本語訳を付けることに重点を置いたため、それ以外にも誤訳や関連synsetと照らし合わせて不適切な訳もまだ残っていると思われます。そのような訳を発見された場合、是非こちらまでお知らせください。

4 関連synsetとのリンク

そのsynsetと関連するsynsetとのリンク情報です。それぞれ以下の事柄を意味します(Wikipediaにも詳しい説明があります)。
注1) リンクの日本語名はまだ仮のものです
注2) 全てのsynsetに日本語synonymが付与されているわけではありませんので、例では英語synonymを使用しました

リンクの名称と意味
省略名 非省略名 日本語名 意味
Hype Hypernym 上位語 当該synsetが相手synsetに包含される "canis familiaris"(02084071-n)は"domestic animal"(01317541-n)と"canid"(02083346-n)に包含される
Hypo Hyponym 下位語 当該synsetが相手synsetを包含する "canis familiaris"(02084071-n)は"toy canis familiaris"(02085374-n),"mutt"(02084861-n),"pooch"(02084732-n),...を包含する
Mprt Meronyms --- Part 被構成要素(部分) 当該synsetが相手synsetという部分によって構成される "canis familiaris"(02084071-n)は"flag"(02158846-n)を一部分として持つ
Hprt Holonyms --- Part 構成要素(部分) 当該synsetが部分として相手synsetを構成する "flag"(02158846-n)は"canis familiaris"(02084071-n)や"cervid"(02430045-n)の一部分である
Hmem Holonyms --- Member 構成要素(構成員) 当該synsetが相手synsetの構成員である "canis familiaris"(02084071-n)は"02083863-n"(canis)や"pack"(07994941-n)の構成員である
Mmem Meronyms --- Member 被構成要素(構成員) 当該synsetが相手synsetという構成員によって構成される "canis"(02083863-n)は"canis familiaris"(02084071-n)や" jackal"(02115096-n)、"wolf"(02114100-n)を構成員として持つ
Msub Meronyms --- Substance 被構成要素(物質・材料) 当該synsetが相手synsetという物質or材料によって構成される "ozone"(14972807-n)は"atomic number 8"(14648100-n)という物質を構成要素として持つ
Hsub Holonyms --- Substance 構成要素(物質・材料) 当該synsetが相手synsetを構成する物質or材料である "atomic number 8"(14648100-n)は"ozone"(14972807-n)や"water"(14845743-n)、"air"(14841267-n)を構成する物質である
Dmnc Domain --- Category 被包含領域(カテゴリ) 当該synsetが相手synsetのカテゴリに属する "comet"(09251407-n)は"astronomy"(06095022-n)のカテゴリに属する
Dmtc In Domain --- Category 包含領域(カテゴリ) 当該synseが相手synsetが属するカテゴリである "astronomy"(06095022-n)というカテゴリには"uprise"(01970348-v)や"absolute magnitude"(05090979-n)が属している
Dmnu Domain --- Usage 被包含領域(語法) 当該synsetの用法が相手synsetの領域に限られる "jean"(03594734-n)の用法は"plural form"(06295235-n)に限定される
Dmtu In Domain --- Usage 包含領域(語法) 当該synsetの領域が相手synsetの用法を規定する "plural form"(06295235-n)は"jean"(03594734-n)の用法を規定する
Dmnr Domain --- Region 被包含領域(地域) 当該synsetが相手synsetの地域に属するものである "sake"(07891433-n)は"nippon"(08921850-n)という地域に属している
Dmtr In Domain --- Region 包含領域(地域) 当該synsetが相手synsetの属する地域である "nippon"(08921850-n)は"sake"(07891433-n)の属する地域である
Inst Instances 当該synsetは相手synsetの例である "seiji ozawa"(11219502-n)は"director"(09952539-n)の例である
Hasi Has Instance 例あり 当該synsetは相手synsetを例として持つ "director"(09952539-n)は"seiji ozawa"(11219502-n)を例に持つ
Enta Entails 含意 当該synsetを行う場合、必ず相手synsetも行っている "fleece"(02319050-v)を行う場合、必ず"charge"(02320374-v)も行っている
Caus Causes 引き起こし 当該synsetを行うと、相手synsetを引き起こす "project"(02138075-v)を行うと、"appear"(00422090-v)を引き起こす
Also See also 関連 当該synsetと相手synsetとの間に何らかの関連がある "white"(00393105-a)は"light"(00408660-a)との間に何らかの関連がある
Attr Attributes 属性 (a=形容詞のsynsetから見て)当該synsetが相手synsetという属性を表す際に使われる "white"(00393105-a)は"value"(04979425-n)という属性を表す際に使われる
(n=名詞のsynsetから見て)当該synsetという属性を表す際に相手synsetを使う "value"(04979425-n)という属性を表すのに"white"(00393105-a)を使う
Sim Similar to 近似 当該synsetは表す意味が相手synsetと近似している "white"(00393105-a)は意味が"albescent"(00393422-a)と近似している

5 他の言語資源とのリンク

情報の補強のために他の概念辞書の情報ともリンクしています。

SUMO: Suggested Upper Merged Ontology

IEEEからリリースされている概念辞書で、英語ワードネットとのリンク情報もリリースされているため、日本語ワードネットでもそのまま利用しています。 "⊂"はそのsynsetがSUMOの概念に包含される、"="はSUMOの概念と合致している、ということを表しています。

6 画像

画像」のページをご覧ください。

品詞・同義語詳細

synset番号と品詞の関係について

synset番号の末尾は品詞を表していますが、これは英語ワードネットのものをそのまま利用しているため、日本語の品詞と異なる場合があります。
具体的には、おおよそ以下のものを含んでいます。

品詞対応表
末尾 意味する(英語での)品詞 対応する(日本語の)品詞 説明 実際の登録例
n 名詞 名詞
複合名詞

2つ以上の名詞が組み合わさったもの
「犬」
「品質管理」
v 動詞 和語動詞
サ変動詞
複合動詞
動詞句
ウ段で終止する動詞
後ろに「する」を付けて使用する動詞
2つ以上の動詞が組み合わさったもの
「目的語+動詞」
「書く」
「勉強」注)
「引き抜く」
「いびきをかく」
a 形容詞 形容詞
形容動詞
形容動詞
連体詞
接頭詞
動詞を加工したもの
終止形が「XXい」である形容詞
終止形が「XXだ」である形容詞
終止形が「XXたり」である形容詞
自立語と考えられ、名詞を修飾するが活用しないもの
非自立語で、常に名詞の直前にあってその名詞を修飾するもの
動詞を連体修飾形に加工したもの
「早い」
「勤勉」注)
「溌刺たる」
「ほんの」
「準-」
「酔った」
r 副詞 副詞
形容詞連用形
副詞句

「XXい」→「XXく」、「XXだ」→「XXに」、「XXたり」→「XXと」
「直接」
「注意深く」、「慎重に」、「堂々と」
「終始一貫して」
注) 次回以降のバージョンで、サ変動詞は「XXする」(「勉強する」等)、形容動詞は「XXだ」(「勤勉だ」等)に登録形を変更する可能性があります。

実際の同義語

選定について
人手でチェックした際には、なるべく概念を的確に言い表せる語を選定しました。そのため、日本語の同義語が、英語の同義語の一般的な訳と異なる場合があります。
例えば、海洋動物の"seal"は「アザラシ」と訳されることが一般的ですが、正しくは「アザラシ、アシカなどの総称」ですので、"seal"(02076196-n)の同義語に「アザラシ」を登録しておりません。
「アザラシ」は下位概念の"earless seal"(02079389-n)の意味するところと合致していますので、こちらの同義語に登録しています。
ただ、実際のsynsetには定義に適切に当てはまる語だけでなく、本来は下位概念に当たるものが含まれている場合があります。例えば「犬」(02084071-n)の同義語に含まれる「洋犬」です。
これは合致するsynsetが現在存在しないための仮の措置で、新しいsynsetを作成するなど、順次対応して行く予定です。
敬語・俗語
敬語や俗語等の扱いはsynsetごとに異なっています。
通常は"mother"(10332385-n)の同義語に「母」とその尊敬語である「母御」が含まれているように、同一synsetの同義語として扱っていますが、"marihuana"(02949691-n)「マリファナ」と、その俗称"weed"(03990834-n)「草」が別個のsynsetになっている場合もあります。
この扱いの差は英語ワードネットに由来する(英語ワードネットのsynsetの定義や、synsetどうしの関係性を改変していない)もので、これに対応する場合は英語ワードネットと歩調を合わせて行うことになると思われます。
表記等について
日本語ワードネットの同義語には基本的にカッコや記号を使用していません(接頭詞につける「-」を除く)。
これはコンピュータに読み込ませることを念頭に置いたためでもありますが、カッコ等による補足がないと概念に合致しないものは基本的に同義語として不適切であると考えているためです。
また、現状では表記の異なりに対して対応できておりません。
例えば「引き抜く」も「引きぬく」も「ひき抜く」も「ひきぬく」も全く別個の語として扱われています。こちらも整理を進めて行く予定です。
ただし、「読み」に関しての対応は未定で、例えば「止める」が「とめる」なのか「やめる」なのかは明示しておりません。
品詞ごとに
n=名詞
一般的な国語辞典で名詞と形容動詞の両方の品詞を付与されている語は、基本的にn=名詞のsynsetには登録していません。
例えば、「粗悪」の場合、「粗悪を極める」という表現が可能なので名詞にも見えますが、本質は形容動詞であり、 また、「XXを極める」などの数種の表現に限られてしまいますので、a=形容詞のsynsetにのみ登録し、その代わりに「粗悪さ」 をn=名詞のsynsetに登録しています。
v=動詞
終止形、あるいは(サ変動詞単独の場合)「する」を取った形で登録しています。
動詞句は極力避けましたが、概念を言い表すために避けられない場合は同義語に登録している場合もあります。
例えば"snore"(00017031-v)に対する「いびきをかく」については、英語では"snore"という自動詞的な言い表し方をしますが、日本語ではどんなに簡潔にしても「いびきをかく」としか表現しようがないために登録してあります。
a=形容詞
形容詞(終止形が「XXい」となるもの)は終止形で、形容動詞(終止形が「XXだ」となるもの)は「だ」を取った形(=語幹、例えば「簡単」という形)で登録しています。
ただし、終止形が「XXたり」となる文語由来の形容動詞は「XXたる」の形となっています。
また、英語の形容詞には日本語における連体詞や接頭詞のようなものも含まれるので、a=形容詞のsynsetの同義語として登録しています。
このうち接頭詞は「XX-」のように後ろに「-(半角ハイフン)」を付けた形にしています。
r=副詞
日本語において副詞に分類されるものの他に、形容動詞の連用形「XXく」、形容動詞の連用形「XXに」、終止形が「XXたり」である形容動詞の連用形「XXと」も含まれます。

その他

期待した情報がhitしないときは...

表記を変えてみてください。
前述しましたが、異表記への対応ができておりません。漢字⇔仮名、送り仮名の違いでhitするものが変わってくる可能性があります。
あるいは、hitしたsynsetの上位or下位のsynsetも参照してみてください。
前述の"seal"と「アザラシ」の関係のように、本当は意味的にずれがある、という場合があります。

検索フォームが使いにくいと感じられる場合は...

他に当機構言語グリッドプロジェクトによるものや、有志の方が作成して下さった検索ページがございます。
また、日本語ワードネットのデータは無償でご利用いただけますし(ライセンスもご覧ください)、数種のプログラミング言語のフロントエンドも有志の方が作成してくださいました(Perlは当プロジェクトによります)ので、経験のある方は是非自作にご挑戦ください。
これらは「概要」のページからリンクしております。
Francis Bond <bond@ieee.org>