検索にヒットしない・ヒットしすぎる

トップ  前へ  次へ

 

【このページの主な項目】

インデックス構築状況の問題
検索キーワードの問題

 

インデックス構築状況の問題

 

この項では全文検索インデックスの問題について解説しています。

 

現象

 

キーワード検索に、目的のファイルがヒットしません。

 

原因

 

以下の原因が考えられます。

目的のファイルが全文検索インデックスに、"まだ"登録されていない。(登録待ち状態)
目的のファイルが全文検索インデックスに、登録されていない。(登録もれの状態)

 

解決方法

 

全文検索インデックスに登録中かどうかは [システム設定] → [インデックス構築状況] で確認できます。処理中のステータスの各項目で、処理が完了しているかどうか確認してください。完了してない場合は、全ての処理が完了してから再度検索を行ってください。
検索インデックスの登録処理が終わっているにもかかわらず検索にヒットしない場合は、目的のファイルが保存されているフォルダをFileBlogで開いて、ファイル操作メニューの管理者メニューで、インデックスの再構築を行ってください。
登録もれのファイルがある場合には、インデックスの再構築で改善されるはずです。[システム設定]→[インデックス構築状況]よりすべての処理が完了したことを確認してから、再度検索を行ってください。

 

 

検索キーワードの問題

 

現象

 

「あれ、なんで見つからないの?」「なんでこんなのがヒットするの?」ここでは、全文検索の結果に違和感を覚えるケースについて解説します。

 

原因

 

FileBlogが採用している検索方法の特性により、検索結果が予期したものと異なってしまう場合があります。

 

解説

 

FileBlog全文検索の特性

 

1.まず、全角文字列と半角英数文字列は区別して扱われます。

例文1:『英語で「おはよう」はGood morningになります』 は、英数文字列"Good morning"部分と、その他に分けて扱われます。
 

2.半角文字列は、原則として単語全体の一致でヒットします。

上記の例文1は「Good」や「morning」で検索するとヒットします。しかしながら、「Goo」や「ing」などの部分文字列ではヒットしません。このため、ID番号などの部分一致検索は出来ません。(たとえば「20100615」は、「2010」ではヒットしません。)ただし、アンダースコア( _ )で分割された文字列の場合は、アンダースコアを区切りとして検索ができます。(たとえば「2010_0615」は、「2010」でヒットします。)

 

3.半角英数の前方一致, 後方一致検索はワイルドカードを使えば可能です。

たとえば「20100615」は「2010*」や「*0615」でヒットします。

 

FileBlogファイル名検索の特性

 

ファイル名検索では、半角全角にかかわらず、部分文字列でヒットします。

全文検索でヒットしない半角の部分文字列もヒットするように、ファイル名専用の検索インデックスを構築しています。

ファイル名専用インデックスでは、ファイル名を単語分割する際に、文字列長1~15のNグラム方式を取っています。15文字を越えるキーワードで検索する場合、キーワードが一つであればヒットします。

       

FileBlog全文検索・ファイル名検索 共通の特性

 

英数文字については、全角・半角の区別なく検索することができます。

 

 


Copyright © 2016 Teppi Technology Co. Ltd. All rights reserved.