テキスト抽出エンジン

Microsoft Word・Excel・PowerPointファイルにおいて、FileBlogは検索インデックスのためのテキスト情報抽出にFileBlogパッケージに含まれるプログラム(xdoc2txt)、またはMicrosoft Office IFilterを使用します。

Microsoft OneNote(one)・Publisher(pub)ファイルの全文検索にはMicrosoft Office IFilterが必要です。

  • Microsoft Office IFilterはMicrosoft社が提供するテキスト抽出エンジンです。

  • FileBlogではMicrosoft Word・Excel・PowerPointファイルのテキスト抽出にMicrosoft Office IFilterを使用できるようにしています。

    • Microsoft Office IFilterがインストールされていない場合はxdoc2txtを使用し、インストールされている場合はMicrosoft Office IFilterを使用します。

  • Windows Server OSの出荷状態では、docx・xlsx・pptxファイル向けのIFilterはインストールされていません。

    • doc・xls・pptファイル向けのIFilterは標準インストールされています。

  • xlsx・docx・pptxファイルについてもIFilterでテキスト情報を抽出させるには、Microsoft Office IFilterのインストールが必要です。

  • Microsoft OneNote(one)・Publisher(pub)ファイルの全文検索のためにMicrosoft Office IFilterをインストールすると、xlsx・docx・pptxファイルのテキスト抽出についても自動的にMicrosoft Office IFilterが適用されます。

Microsoft Office IFilterのインストール

次のいずれかの方法でIFilterのインストールができます。

  1. Microsoft Officeをインストールすると自動的にIFilterもインストールされます。

  2. Office 2010 Filter Packをインストールする。