[全体目次 |成果報告書目次]


高速単語重要度計算プロトタイプシステムの開発


前年度には、文書中での単語の話題性を評価する手法について調査検討を 行ない、統計的計量 (representativeness) を求める手法を提案した。
本年度はそれを発展させ、以下の2項目について、調査研究および プログラムの研究開発を実施した。

[1] 文書中での単語の話題性を評価する統計的計量

--- 基本ツールのライブラリ形式化 ---

文書中での単語の話題性を評価する統計的計量をGETAを用いて 計算する際の基本ツールをライブラリの形で整備し、利用マニュアルを作成した。

(1)単語の話題性原指標計算に関する調査研究

(2)話題性原指標計算ライブラリ DREP 使用マニュアル

  • 文書集合に対する話題性原指標計算モジュールの解説、利用方法
  • 単語ブール結合から文書集合への変換モジュールの解説、利用方法

[2] 重要複合語の自動判別化方法

語が複合することにより話題性が高まる「重要複合語」の自動判別方法 について検討し、それを実現するためのプログラムを開発した。

(1)重要複合語の自動判別方法に関する調査・研究

(2)重要複合語の自動判別方式の評価

(3)複合語の孤立性に基づく重要性判定プログラム(解説と利用方法)