IFilterを使用する方法

トップ  前へ  次へ

 FileBlogの標準のテキスト抽出エンジンは、xdoc2txt.exeですが、ファイル種類によっては、Microsoftが提供するIFilterを用いることができます。

 IFilterは、Microsoftが提供するテキスト抽出エンジンですので、WordやExcel, PowerPointといったファイルのテキスト抽出はxdoc2txtに比べ、多くの場合、高速に処理することができるようです(弊社テストによります)。

 また、IFilterの拡張ライブラリ(有償もしくは無償)をインストールすることで、FileBlogの標準機能では抽出できないファイル形式でも検索対象にすることが可能です。

参考URL:http://www.microsoft.com/japan/sharepoint/server/downloads/IFilter.mspx

 

使用方法

1.IFilterで抽出させたいファイルの種類を 仮に "DOC" とします。(最新版を新規インストールすると既定ではMS Office, Adobe PDFはifilterを使用するように設定されています)
2.ファイル種類の[全文検索対象]に DOC を指定してください。この項目に指定がないと、そのファイル種類についてテキスト抽出が行われません。
3.ファイル種類の[IFilter利用]に DOC を指定して下さい。この項目に指定がない場合、xdoc2txt.exeが使用されます。また、対応するifilterがインストールされていない場合もxdoc2txt.exeが使用されます。
4.DOC に対応するIFilter用のライブラリをダウンロード & インストールして下さい。(DOCについては、通常Windowsに標準でインストールされています)
5.Fb3Indexerサービスを再起動します。
6.以上です。

 

参考:MSGファイルをIFilterでテキスト抽出する

 

 


© 2012 Teppi Technology   ※無断転載を禁じます