述語項構造シソーラス

更新情報 2015年4月

動詞項構造シソーラスの登録動詞を拡張し,Lexeed内のほぼ全ての動詞,形容詞,形容動詞について概念と意味役割を付与した述語項構造シソーラスを作成しました (リンクはこちら).下記の内容を包含しつつ,意味役割の体系を整理して72種類,概念も一部整理し直しました.国立国語研究所が出している日本語コーパスに対して,語義と意味役割を付与したデータも作成しています.以降はこちらの方をメインテナンスしていきます.

更新情報 2010年8月3日

Lexeed-IDとの対応を付与しました. これで,学研「基本語データベース」CD-ROM内の語釈文との対応をユーザは知ることが出来ます.
言語処理のための日本語の動詞辞書 (旧動詞項構造シソーラス)

人の言葉をコンピュータで処理するために動詞の概念を整理したコンピュータ用の 辞書を構築してfreeで配布しています(現在4425語(7473語義)).動詞の概念は名詞と異なり,係り関係のある名詞との形が 重要になってきます.例えば

  • 彼が(Agent)秘密を(Theme)握る → 秘密を(Theme)得る
  • 彼が(Agent)おにぎりを(Theme)握る → おにぎりを(Theme)作る
のように表層の格(ガ,ヲ..)と深層格(Agent, Theme,..)との組み合わせで 動詞の持つ意味が異なり,他の動詞との関係が変わってきます(言語学の語彙意味論では深層格と動詞の 関係を項構造と呼びます).このような関係を全ての名詞と動詞の組で 記述するのは不可能ですが,それを推測するのに必要な構築可能な動詞辞書の構築を行っています. 具体的な方針としては
  • 語義を仮定して,語義ごとに表層格を整理して例文を記述する
  • 動詞の内部の意味構造を分解して(語彙概念構造)詳細化した関係で結びつける
  • 深層格のレベルで多重に動詞の意味を分類して関係づける
  • 属性と属性値で整理することでこれからも漸進的に詳細化可能にする
これらを図にまとめてみると下記のようになります(クリックで拡大).動詞の語義は図にあるように 上位事象,下位事象に

語彙分解と動詞分類

分割できることが言語学で議論されてきており,これを多重継承が無い階層的な意味分類 に対応させます.例では「本だなに本を置く」という関係が「本が移動する」と動詞の結果 としては包含関係があり,さらに「本が棚にある」という状態動詞と動作の結果として 包含関係があるということを示しています.

現段階では動詞4425語(7473語義)について人手で分類・付与を行い5階層の分類で細分類で 940分類(自他の異なりも違いとして取り出せます).excelを使って作成したので属性と属性値の表でまとめられています.具体的な 事例はここのリンクで検索して試していただけたらと思います.Excel形式のデータの例を 下図に示そう(図をクリックで拡大).

辞書

各動詞の語義単位で代表例文を作成し,それを表層格で分解して記述します.このとき,単純な 表層格の言い換え関係
  • 飛行機[1]が空港[2]を/から出発する
  • [半統性意味構造記述](着点への移動) ([動作主]の働きかけで) [1]が[2]にいる状態 になる
は併記して記述します.さらに,ガ格,ヲ格が半統性意味構造記述と呼ばれる規格化した動詞の意味表現で との対応を番号で記述します.これによりどういう表層格が移動した対象なのか,もしくは移動先 なのかといった情報が推測できるようにしています.より詳しい説明は下記の参考文献をご参照 ください.

参考文献: 竹内孔一, 乾健太郎, 竹内奈央, 藤田篤,意味の包含関係に基づく動詞項構造の細分類 発表番号: B5-2, 言語処理学会年次大会,2008年3月,東京大学

ニュース

ウェブサイトの更新(2011/12/12)

辞書の説明ページの準備 (2009/4/7) download csvファイルのコンマがずれる不具合を修正 (2008/6/30)
現状説明更新 (2008/6/13)
現状説明を追加 (2008/5/22)
データの説明追加 (2008/5/9)
ウェブサイトを公開 (2008/3/15)
ウェブサイトの書き換え (2008/3/7)
ウェブサイトを新たに作成 (2008/1/21)