検索インデックス設定

<< Click to Display Table of Contents >>

Navigation:  システム管理者リファレンス > 導入時の留意事項 >

検索インデックス設定

 

検索エンジンの設定

全文検索対象ファイル種類

画面下部のシステム設定 > ファイル種類 を開きます。

0085

全文検索対象

全文検索対象となるファイル形式を指定します。

IFilter利用

全文検索対象のファイルのうち、IFilterを使ってテキスト抽出するファイル形式を指定します。

テキスト形式(ascii):

全文検索対象のファイルのうち、ここで指定されたファイル形式については、"xdoc2txt.exe"を使ったテキスト抽出処理をせずに、ファイルの内容をそのまま検索インデックスに登録します。該当するファイルが多い場合、検索インデックスの構築処理スピードが速くなります。

 

検索インデックスの設定

1.画面下部のシステム設定 > Solr(検索エンジン) を開きます。

0059

 

2.インデックス保存フォルダなどを設定します。

0087

 

インデックス保存フォルダの変更

インデックス保存フォルダを変更するケースとして2つあります。

1.フォルダの空き容量が少なくなり、別のドライブに再配置する

フォルダの変更後、インデクサーサービスを停止し、既設フォルダをコピーしてからインデクサーサービスを再開してください。

2. 新規インストール後、インデックス構築を実行する前に標準設定のフォルダから別のフォルダに変更する

フォルダの変更後、インデクサーサービスを停止し、インデックスを初期化してからインデクサーサービスを再開します。それからインデックス再構築を行ってください。

 

更新/削除のタイミング

インデックス再構築/インデックス掃除/ファイルの変更検知(追加/更新/削除)のいずれかの処理により、検索インデックスを登録もしくは削除しますが、複数ファイルをまとめて検索エンジンにアップロードさせることで、処理性能を向上させています。

以下のいずれかの条件にマッチしたい時に、検索エンジンにファイルの変更をアップロードします。

o最大秒数(既定値=20秒)

o最大件数(既定値=1000件)

o最大サイズ(既定値=10485760 byte=10 MB)

検索エンジンにアップロードされれば、その直後から検索可能になります。

同期のタイミングは、更新/削除のタイミングよりも少ない頻度で実行されるように設定して下さい。

同期(hard commit)のタイミング

インデックス再構築/インデックス掃除/ファイルの変更検知(追加/更新/削除)のいずれかの処理により、検索インデックスを登録もしくは削除し、上記「更新/削除のタイミング」で検索エンジンにアップロードされます。

この段階ではまだ検索エンジン内のメモリにキャッシュされただけの状態なので、同期(検索インデックスファイルへの書き込み)が必要です。

以下のいずれかの条件にマッチした時に、自動的に同期(hard commit)が行われます。

o最大秒数(既定値=300秒)

o最大件数(既定値=2000件)

o最大サイズ(既定値=20971520 byte=20 MB)

同期のタイミングは、更新/削除のタイミングよりも少ない頻度で実行されるように設定して下さい。

 

ファイルが変更されてから検索が可能になるまでの流れ

1.ドキュメントルートにあるファイルが変更され、FileBlogがその変更を検知します。

2.変更されたファイルから全文テキストを抽出し、検索エンジンに登録(アップロード)します。

3.検索可能ができるようになります。

※ 同期(hard commit)が実施されていなくても、メモリ上にキャッシュされたインデックスも検証対象となるので、アップロード直後から検索可能になります。これはSolrのsoft commit機能による効果です。