検索にヒットしない・ヒットしすぎる

<< Click to Display Table of Contents >>

Navigation:  あれっ?と思ったら >

検索にヒットしない・ヒットしすぎる

 

インデックス構築状況の問題

この項では全文検索インデックスの問題について解説しています。

 

現象

キーワード検索に、目的のファイルが検索結果に表示されない。

 

原因

次の原因が考えられます。

目的のファイルが全文検索インデックスに、まだ登録されていない。(登録待ちの状態)

目的のファイルが全文検索インデックスに、登録されていない。(登録もれの状態)

 

解決方法

検索インデックスの登録処理状況は、「画面下部のシステム設定 > システム状態 > インデックス構築状況」で確認できます。処理中のステータスの各項目で処理状況を確認してください。完了してない場合は、全ての処理が完了してから再度検索を行ってください。

検索インデックスの登録処理が完了しているのに検索結果に表示されない場合は、目的のファイルが保存されているフォルダをFileBlogで開いて、「ファイルボタン > 管理者メニュー > インデックス/プレビュー再構築」で、インデックスの再構築を行ってください。

インデックス登録にもれてしまったファイルの場合には、インデックスの再構築で改善されます。

 

検索キーワードの問題

現象

「あれ、なんで見つからないの?」「なんでこんなファイルが検索されるの?」など、全文検索の結果に違和感を覚えるケースです。

 

原因

FileBlogが採用している検索方法の特性により、検索結果が予期したものと異なってしまう場合があります。

 

解説

全文検索の特性

1.全角文字列と半角英数文字列は区別して扱われます。

例文)『英語で「おはよう」はGood morningになります。』

これは、英数文字列「Good morning」部分と、その他に分けて扱われます。
 

2.半角文字列は、原則として単語全体の一致で検索します。

例文では、「Good」や「morning」で検索できますが、「Goo」や「ing」などの部分的な文字列では検索できません。

このため、ID番号や日付などの数字の文字列では、部分一致の検索はできません。

例えば、「20100615」は、「2010」では検索できません。

ただし、アンダースコア( _ )やハイフン( - )などの記号で区切られた文字列の場合は、記号を区切りとして検索ができます。

例えば、「2010_0615」は、「2010」で検索できます。

 

3.半角英数の前方一致, 後方一致検索はワイルドカードを使用すると検索できます。

たとえば「20100615」は「2010*」や「*0615」でヒットします。

 

ファイル名検索の特性

ファイル名検索では、文字が半角全角にかかわらず部分的な文字列で検索できます。

全文検索では検索できない半角の文字列も検索できるように、ファイル名検索用の検索インデックスを構築しています。

ファイル名検索用のインデックスでは、ファイル名の単語分割に文字列長 1~15 のNグラム方式にしてあります。

15文字を越えるキーワードで検索する場合、キーワードが一つであれば検索できます。

 

全文検索・ファイル名検索の共通特性

英数・カタカナについては、全角・半角の区別なく検索することができます。

例文)『「Good mornig」はグッドモーニング、「123」はワンツースリーになります。』

「good」「MORNING」「グッド」「123」「ワンツー」などで検索できます。