全文検索システム「Estraier」+「MeCab」の導入

分かち書きに「MeCab」を利用して「Estraier」を導入する。
ここでは
/var/www/html/
以下のすべてを検索対象ディレクトリとし、転置インデックスを
/var/www/estraier/
に作成するものとする。
なお、「Apache」の設定は完了済みとする。

「Estraier」のインストール

「libiconv」のインストール

まず、「libiconv」をインストールするが、この時日本語のパッチも適用する。

[root@Fedora ~]# mkdir /usr/local/src/libiconv <= 作業用ディレクトリの作成
[root@Fedora ~]# chmod 777 /usr/local/src/libiconv <= 作業用ディレクトリのパーミッション変更
[root@Fedora ~]# exit <= 一般ユーザになる
[kaz@Fedora ~]$ cd /usr/local/src/libiconv <= 作業用ディレクトリへ移動
[kaz@Fedora libiconv]$ wget http://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.10.tar.gz
 <= 「libiconv」のソースをダウンロード
[kaz@Fedora libiconv]$ wget http://www2d.biglobe.ne.jp/~msyk/software/libiconv/libiconv-1.10-ja-1.patch.gz
 <= 「libiconv」のパッチをダウンロード
[kaz@Fedora libiconv]$ tar xzf libiconv-1.10.tar.gz <= ダウンロードしたファイルの展開
[kaz@Fedora libiconv]$ cd libiconv-1.10 <= 展開したディレクトリに移動
[kaz@Fedora libiconv-1.10]$ gzip -dc ../libiconv-1.10-ja-1.patch.gz | patch -p1
[kaz@Fedora libiconv-1.10]$ ./configure 2>&1 | tee configure.log
[kaz@Fedora libiconv-1.10]$ make 2>&1 | tee make.log <= コンパイル
[kaz@Fedora libiconv-1.10]$ su <= スーパーユーザになる
Password: <= パスワードの入力
[root@Fedora libiconv-1.10]# make install 2>&1 | tee make-install.log <= インストール

「MeCab」のインストール

「MeCab」と「MeCab」が利用する辞書の「mecab-ipadic」をインストールする。

[root@Fedora ~]# yum -y install mecab macab-devel mecab-ipadic <= 「MeCab」、「mecab-ipadic」のインストール
[root@Fedora ~]# yum clean packages <= ダウンロードしたパッケージの削除

「Estraier」のインストール

[root@Fedora ~]# mkdir /usr/local/src/estraier <= 作業用ディレクトリの作成
[root@Fedora ~]# chmod 777 /usr/local/src/estraier <= 作業用ディレクトリのパーミッション変更
[root@Fedora ~]# exit <= 一般ユーザになる
[kaz@Fedora ~]$ cd /usr/local/src/estraier <= 作業用ディレクトリへ移動
[kaz@Fedora estraier]$ wget http://estraier.sourceforge.net/estraier-1.2.29.tar.gz
 <= 「Estraier」のソースをダウンロード
[kaz@Fedora estraier]$ tar xzf estraier-1.2.29.tar.gz <= ダウンロードしたファイルの展開
[kaz@Fedora estraier]$ cd estraier-1.2.29 <= 展開したディレクトリに移動
[kaz@Fedora estraier-1.2.29]$ ./configure --enable-regex --enable-dlfilter --enable-mecab 2>&1 | tee configure.log
[kaz@Fedora estraier-1.2.29]$ make 2>&1 | tee make.log <= コンパイル
[kaz@Fedora estraier-1.2.29]$ su <= スーパーユーザになる
Password: <= パスワードの入力
[root@Fedora estraier-1.2.29]# make install 2>&1 | tee make-install.log <= インストール
「Estraier」の実行

転置インデックス格納先ディレクトリの作成

[root@Fedora ~]# mkdir /var/www/estraier

「Estraier」の新規実行

「Estraier」を新規に実行する場合は以下のようにする。

[root@Fedora ~]# estindex register /var/www/estraier/crimson-snow /var/www/html <= 転置インデックスの作成
[root@Fedora ~]# estindex relate /var/www/estraier/crimson-snow <= 転置インデックスに関連文書検索用のスコア情報を追加

「Estraier」の実行

ページに更新があった後、「Estraier」を実行する場合は以下のようにする。

[root@Fedora ~]# estindex purge /var/www/estraier/crimson-snow <= サイトから削除された文書を転置インデックスからも削除
[root@Fedora ~]# estindex register /var/www/estraier/crimson-snow /var/www/html <= 転置インデックスの作成
[root@Fedora ~]# estindex optimize /var/www/estraier/crimson-snow <= 転置インデックスの更新で生じた不要な情報を削除
[root@Fedora ~]# estindex relate /var/www/estraier/crimson-snow <= 転置インデックスに関連文書検索用のスコア情報を追加
「Estraier」の設置

設定ファイル等格納先ディレクトリの作成

[root@Fedora ~]# mkdir /var/www/cgi-bin/estraier

各種ファイルのコピー

[root@Fedora ~]# cp /usr/local/libexec/estsearch.cgi /var/www/cgi-bin/estraier/estsearch.cgi
[root@Fedora ~]# cp /usr/local/share/estraier/locale/ja/estsearch.conf /var/www/cgi-bin/estraier/estsearch.conf
[root@Fedora ~]# cp /usr/local/share/estraier/locale/ja/estsearch.tmpl /var/www/cgi-bin/estraier/estsearch.tmpl
[root@Fedora ~]# cp /usr/local/share/estraier/locale/ja/estsearch.top /var/www/cgi-bin/estraier/estsearch.top

「Estraier」の設定

[root@Fedora ~]# vi /var/www/cgi-bin/estraier/estsearch.conf <= 設定ファイルの編集
indexname: casket
↓
indexname: /var/www/estraier/crimson-snow <= 転置インデックスを指定

prefix: ./
↓
#prefix: ./ <= コメントアウト

replace:
↓
replace: /var/www/html/ http://www.crimson-snow.net/ <= 検索対象ディレクトリの置換

ブラウザで
http://サーバのIPアドレス/cgi-bin/estraier/estsearch.cgi
とアクセスする。

サイト内に設置する場合

サイト内に検索用のFORMを設置する場合、設置したい場所に以下の内容を記述。

<FORM method="get" action="/cgi-bin/estraier/estsearch.cgi">
  <DIV>
    <INPUT type="text" name="phrase" value="" size="64" tabindex="1" />
    <INPUT type="submit" value="Search" tabindex="2" />
    <INPUT type="hidden" name="enc" value="UTF-8" />
  </DIV>
</FORM>
転置インデックスの自動作成&不要データ削除
[root@Fedora ~]# vi /root/estraier.sh <= 転置インデックスの自動作成&不要データ削除スクリプト作成
#!/bin/sh

ESTINDEX='/usr/local/bin/estindex'

$ESTINDEX purge /var/www/estraier/crimson-snow > /dev/null 2>&1
$ESTINDEX register /var/www/estraier/crimson-snow /var/www/html > /dev/null 2>&1
$ESTINDEX optimize /var/www/estraier/crimson-snow > /dev/null 2>&1
$ESTINDEX relate /var/www/estraier/crimson-snow > /dev/null 2>&1


[root@Fedora ~]# chmod 744 /root/estraier.sh <= 作成したスクリプトに実行権限付加

スクリプトの自動実行

[root@Fedora ~]# crontab -e <= 設定ファイルの編集
00 03 * * * /root/estraier.sh <= 追加(毎日3:00にスクリプト実行)
▲ページのトップへ