テキスト抽出エンジンIFilterの使用について

<< Click to Display Table of Contents >>

Navigation:  システム管理者リファレンス > 導入時の留意事項 > 検索インデックス設定 >

テキスト抽出エンジンIFilterの使用について

 

IFilter について

FileBlogは、検索インデックスのテキスト抽出に xdoc2txt または IFilter プログラムを使用しています。

標準のテキスト抽出エンジンは、xdoc2txt ですが、ファイル種類によっては Microsoft が提供する IFilter を用いることができます。

IFilter は、Microsoft が提供するテキスト抽出エンジンで、Word, Excel, PowerPointなどのファイルのテキスト抽出に向いていて、xdoc2txt に比べて高速に処理することができます。(当社テストにおいて)

Microsoft Outlookメッセージ形式ファイル(.msg)や、Microsoft Visio の全文検索を行う場合には、IFilter のインストールが必須です。

 

Outlook msgファイル用IFilter、Visio用IFilterを含む 「Microsoft Office 2010 フィルタパック」は2018年6月現在、下記のURLからダウンロードできます。

http://www.microsoft.com/ja-jp/download/details.aspx?id=17062

microsoftフィルタパックには、Microsoft Searchサービスが必要です。

FileBlogは、Windows 64bit系OSにしか対応しておりませんので、 「Microsoft Office 2010 フィルタパック」の"FilterPack64bit.exe"をダウンロードおよびインストールしてください。

さらに、64bit用のIFilterである「FilterPack64bit.exe」を利用するには、FileBlogのVersion3.14以降が必要です。3.14未満のVersionでは動作しません。

 

使用方法

1.画面下部のシステム設定 > ファイル種類 を開きます。

0093

 

2.IFilter を使用するファイル種類を指定します。

標準では、Microsoft Office、Adobe PDF が、IFilter を使用するように設定されています。

0094

 

3.例として、Wordファイル(.doc)を IFilter 使用に指定します。

a.「全文検索対象」に、doc を指定します。

この項目に指定がないファイル種類は全文検索の対象になりません。

b.「IFilter 利用」に、doc を指定します。

この項目に指定がない場合、標準の xdoc2txt が使用されます。

対応する IFilter がインストールされていない場合も xdoc2txt が使用されます。

doc に対応するIFilter用のライブラリをインストールしてください。(doc については、Windowsに標準でインストールされています。)

4.「保存する」ボタンを選択して、「今すぐ再起動する」を選択してサービス再起動を行ってください。