====================================================================== Perlインタフェースを利用した評価用連想検索 GUI 2001年2月22日(木) ====================================================================== 0. ファイル構成 README.ja 日本語 README (このファイル) assoc.cgi 連想検索を行なう CGI スクリプト config.pl 設定ファイル jpn.sh 形態素解析スクリプト mkhtml.cgi 記事本文を表示する CGI スクリプト search.html 検索メインページ (JavaScript版) search.shtml 検索メインページ (SHTML版) 1. はじめに 本システムは,汎用連想計算エンジン GETA を用いた評価用連想検索 GUI です。GETA 付属の WAM モジュール (wam.pm) を介して GETA のライブラ リ群にアクセスすることで,連想検索を実現しています。Perl で記述した CGI スクリプトとして実装されているため,Web サーバ上で動作し,Web ブラウザから利用できます。 なお,WAM モジュールの詳細については, $GETASRC/ext/wam/doc/{wam_man.html,tutorial.html} または, $GETAROOT/ext/wam/doc/{wam_man.html,tutorial.html} を参照して下さい。 2. 動作環境 本システムを動作させるためには,以下の環境が必要です。 ・Perl5 (5.0 patchlevel 5 subversion 3) ・GETA に含まれる WAM モジュール (wam.pm) ・日本語形態素解析システム「茶筌」version 2.0 ・Web サーバ (CGI スクリプトを実行できる環境) ・Web ブラウザ ・Network Kanji Filter (nkf) なお,開発および動作確認は以下の環境で行ないました。 ・Perl version 5.00503 ・茶筌 version 2.02 ・Apache 1.3.3 / 1.3.11 ・Netscape Communicator 4.08 / Netscape Navigator 4.04 ・Network Kanji Filter (nkf) Version 1.62 3. インストール a. 以下のファイルを CGI スクリプトを実行できるディレクトリにコピーし て下さい。 search.html search.shtml jpn.sh config.pl assoc.cgi mkhtml.cgi b. $GETASRC/images/geta_power_s.jpg を上記と同じディレクトリにコピー して下さい。 c. jpn.sh, config.pl に含まれる変数を適宜修正して下さい。少なくとも 以下の変数が正しく設定されているかどうかを確認しておく必要があり ます。 ・jpn.sh NKF nkf のパス CHASEN 茶筌のパス ・config.pl $GETAROOT GETA をインストールしたディレクトリ %CORPUS 検索対象文書に関する設定 上記以外のパス名については,ファイル中のコメントを参照して下さい。 d. $GETASRC/testsuit に含まれている test1 がセットアップされていれば, これで検索のテストができます。なお test1 には本文がありませんので, 本文を見ることはできません。 e. 新聞記事などを検索したい場合は, mai-cvt (毎日新聞用) nik-cvt (日経新聞用) をご利用下さい。詳しくはそれぞれに付属のドキュメントを参照して下 さい。 mai-cvt/nik-cvtを使って,毎日新聞/日経新聞をセットアップした後, config.pl の %CORPUS 検索対象文書 を適切な値に設定して下さい。例えば,毎日新聞98年版を ハンドル名 mai98 タイトルファイル $GETAROOT/data/jpn/mai/mai98/titles mai-cvt /usr/local/lib/mai-cvt/mk-html 日経新聞98年版を ハンドル名 nik98 タイトルファイル $GETAROOT/data/jpn/nik/nik98/titles nik-cvt /usr/local/lib/nik-cvt/mk-html でセットアップした場合は, %CORPUS = ( 'mai98' => { 'label' => "毎日新聞 [1998]", 'title' => "$GETAROOT/data/jpn/mai/mai98/titles", 'mk-html' => "/usr/local/lib/mai-cvt/mk-html", 'ma' => "./jpn.sh" }, 'nik98' => { 'label' => "日経新聞 [1998]", 'title' => "$GETAROOT/data/jpn/nik/nik98/titles", 'mk-html' => "/usr/local/lib/nik-cvt/mk-html" } ); とします。これで毎日新聞98年版,日経新聞98年版の検索および本文表 示が行なえます。 4. 使い方 a. Web ブラウザで検索メインページ search.shtml (WebサーバがSHTML) に対応している場合)もしくは search.html を開いて下さい。 b. フレーズ検索,文書連想検索,トピックワード検索が可能です。 c. それぞれの検索において,検索対象文書,表示件数,類似性尺度を変更 できます。 d. [フレーズ検索] 検索質問を入力して 「Go」ボタン を押すと検索結果が表示されます。 複数行にわたる検索質問を入力する場合は [LONG QUERY] という名前の リンクをクリックして下さい。大きな入力窓が現れます。 e. [文書連想検索] 必要な記事を選択して 「search related item」ボタン を押して下さい。文書連想検索の結果が表示されます。 記事を選択したコーパスとは異なるコーパスを選択することでクロスデー タベース検索を行なうことができます。 f. [トピックワード検索] 必要な単語を選択して 「search related item」ボタン を押して下さい。トピックワード検索の結果が表示されます。 トピックワードを選択したコーパスとは異なるコーパスを選択すること でクロスデータベース検索を行なうことができます。 g. 記事本文を読みたい場合は,記事タイトルをクリックして下さい。 以上 ----------------------------------------------------------------------