会話型知識プロセスのための テキストの自動プレゼンテーション by 黒橋 et al. ’05

黒橋 禎夫,大泉 敏貴,大西 貴士,柴田 知秀,鍜治 伸裕,河原 大輔,岡本 雅史,西田 豊明
2005年情報学シンポジウム講演論文集--社会システムを支える情報学 ; セッション5:知識獲得・記述の支援 情報学シンポジウム講演論文集 / 情報学シンポジウム実行委員会 編 p.145-152

http://ipsj-ifat.org/sympo/2005/OnlineProceedings/2005InfoSympo13.pdf
http://iss.ndl.go.jp/books/R000000004-I7699604-00

会話の場に知識ベースを提示することを目的とした、自動スライド生成システム。すでにできている「知識カード」に様々な処理を施してスライドの形に変換し、クエリを与えると関連するスライドを表示する。

知識カードとはこんなもの。

これを、こんなふうに出力する。

これをやるのがどれだけ大変かというと:

  1. 「誰が何をどうした」のような述語・項構造を解析する。これを行うにはどのような出来事が常識的にどれくらいの頻度で起こり得るかを表現した格フレームが必要になる。さらに「荷物を積む」と「経験を積む」のように「積む」の意味が異なるものも別に扱えるように、動詞と直前の項をペアで考慮した格フレーム学習を行っている。[5]
  2. 複数の文の間の関係を求める文章構造解析を行う。文の間の関係としては,並列,対比,主題連鎖,焦点主題連鎖,詳細化,理由,原因, 結果,変化,例提示,例説明,質問応答などがある。これは接続詞などを見て、ルールベースで解析を行う。
  3. 書き言葉話し言葉変換を行う。書き言葉特有表現(普通体・文語調・書き言葉特有語彙)、複雑な構造(名詞化された用言・埋め込み文や連用修飾を含む長文)、音声化に適さない表現(記号表現、参照表現)を変換する。
  4. 自動要約を生成する。まず、見出し語の抽出と重要説明表現の抽出を行い、次に文章構造に応じてレイアウトする。

かなり端折っているが、それぞれかなり泥臭いルールの適用で処理を行っている。