一億文書検索」に掲載している以下の5つのコンテンツをまとめたものです。

  1. Apache Solr Cloudで一億文書の大規模ファイルサーバ全文検索システムを作ってみた
  2. ファイルサーバ検索にApache Solrは「使える」。ただし・・・
  3. ファイルサーバ検索におけるSolrCloudの活かし方
  4. ファイルサーバ検索だから「手抜き」できること
  5. シンプルなSolrCloudなら、管理も簡単です

パッケージとして販売されているファイルサーバ検索システムの多くは、「1 千万文書の大規模検索が可能」など、その高性能をアピールしていますが、実際には何千万文書ぐらいまでの全文検索に利用できるのでしょうか。多くの製品が、ノンカスタマイズでパッケージとして対応できる文書数は、1千万文書の大台あたりであるように思われます。

弊社のファイルサーバ全文検索システム「FileBlog」も、3000 万文書クラスの検索まではノンカスタマイズで対応していますが、これを実証するために、実際に一桁上の「1億文書」の全文検索インデックスを構築してみることにしました。

続きはPDFのダウンロード、または上記リンク先をご覧ください。