検索エンジン(Solr)について

<< Click to Display Table of Contents >>

Navigation:  システム設定(管理者マニュアル) > 詳細設定 >

検索エンジン(Solr)について

 

FileBlogでは、検索エンジン(Solr)の設定を変更できるようにしてありますが、一部を除いてはデフォルト設定を推奨します。

設定のほかに、インデックス初期化などいくつかの操作ができるようになっています。

 

検索エンジンの設定を変更する

1.設定ボタン > システム設定 > Solr(検索エンジン) を開きます。

0059

2.下記を参考に各種設定値の変更や操作を行ってください。

3.変更後は、設定を保存してサービスを起動すると反映されます。

検索エンジンの設定

re0206

 

項目

説明

初期/最大ヒープメモリサイズ

検索エンジンが占有するメモリの容量です。

この値が小さいと検索性能等に影響がおよぶため、導入当初から文書数が大量にある場合や、使用中に文書数が増加した場合には変更が必要です。

更新/削除のタイミング

インデックス再構築/インデックス掃除/ファイルの変更検知(追加/更新/削除)のいずれかの処理により、検索インデックスを登録もしくは削除しますが、複数ファイルのインデックス情報をまとめて検索エンジン内のメモリにキャッシュさせることで、処理性能を向上させています。

次のいずれかの条件に合致したときに、検索エンジンにインデックス情報をキャッシュします。

o最大秒数(既定値=20秒)

o最大件数(既定値=1000件)

o最大サイズ(既定値=10485760 byte=10 MB)

検索エンジンに登録(メモリにキャッシュ)されれば、その直後から検索できるようになります。

同期(hard commit)のタイミング

上記の「更新/削除のタイミング」では、まだ検索エンジンにキャッシュされているだけの状態のため、同期(検索インデックスファイルへの書き込み)が必要です。

次のいずれかの条件に合致したときに、自動的に同期(hard commit)が行われます。

o最大秒数(既定値=300秒)

o最大件数(既定値=2000件)

o最大サイズ(既定値=20971520 byte=20 MB)

同期のタイミングは、更新/削除のタイミングよりも少ない頻度で実行されるように設定して下さい。

セキュリティ情報を埋め込む(aclsearch)

検索インデックスにアクセス権などのセキュリティ情報も一緒に登録します。

検索時の応答性能を向上させます。

ファイルが変更されてから検索が可能になるまでの流れ

1.ドキュメントルートにあるファイルが変更され、FileBlogがその変更を検知します。

2.変更されたファイルから全文テキストを抽出し、検索エンジンに登録(アップロード)します。

3.検索できるようになります。

同期(hard commit)が実施されていなくても、メモリ上にキャッシュされたインデックスも検証対象となるので、アップロード直後から検索可能になります。
これは、Solr のsoft commit 機能による効果です。

検索インデックスの初期化

「インデックスの初期化」ボタンをクリックすると「サービスの停止」ウィンドウが表示されます。

re0195

 

re0201

 

項目

説明

インデックス保存フォルダ

デフォルト設定= $(APPDATA)\SearchIndex
$(APPDATA)= インストールフォルダ(デフォルト C:\Program Files\Teppi Technology\FileBlog\4.0\Data)です。

インデックス保存フォルダの変更方法(インデックス初期化が必須です)

1.インデクサー(FbIndexer)サービスがアクセス可能な実在のフォルダを用意します

2.システム設定 > Solr(検索エンジン) 「サービス」タブ を開き、「Solr」を停止します。

3.システム設定 > Solr(検索エンジン) > インデックスの初期化 を開いて、インデックス保存フォルダに1のフォルダパスを入力します。

4.「インデックスの初期化」ボタンを選択して初期化を実行します。

5.システム設定 > Solr(検索エンジン) 「サービス」タブ を開き、「Solr」を開始します。

6.システム設定 > インデックス構築状況 を開き、「インデックス再構築」を実行します。

インデックステンプレート(zip)

通常変更する必要はありません。

検索エンジン(Solr)のバージョンに対応する検索インデックスの型です。

将来、検索エンジン(Solr)がバージョンアップしたときには変更が必要になる可能性があります。
(テンプレートの変更時にはインデックスの初期化が必要になる場合もあります)

インデックスの初期化

構築済みの検索インデックスを初期化します。(インデックスデータを削除します)

検索エンジンのステータス

検索エンジンの簡単な状況を確認することができます。

re0088

 

項目

説明

ノード

検索エンジンが稼働しているマシンです。

JVM Memory

割り当てたヒープメモリ容量に対する使用量です。

インデックスサイズ

構築済みインデックスデータの容量です。

登録文書数

インデックスとして登録されている文書数です。

コレクション数

設定済みコレクション(インデックスデータ)の数です。
大規模環境では各ドキュメントルートに対して1つのインデックスデータを構築するように設定します。このとき、インデックスデータ=コレクションと表現します。

過去の推移

ログ情報から検索エンジンの状態を抽出して出力します。