検索にヒットしない・ヒットしすぎる |
トップ 前へ 次へ |
【このページの主な項目】
インデックス構築状況の問題
この項では全文検索インデックスの問題について解説しています。
現象
キーワード検索に、目的のファイルがヒットしません。
原因
以下の原因が考えられます。
解決方法
検索キーワードの問題
現象
「あれ、なんで見つからないの?」「なんでこんなのがヒットするの?」ここでは、全文検索の結果に違和感を覚えるケースについて解説します。
原因
FileBlogが採用している検索方法の特性により、検索結果が予期したものと異なってしまう場合があります。
解説
FileBlog全文検索の特性
例文1:『英語で「おはよう」はGood morningになります』 は、英数文字列"Good morning"部分と、その他に分けて扱われます。
上記の例文1は「Good」や「morning」で検索するとヒットします。しかしながら、「Goo」や「ing」などの部分文字列ではヒットしません。このため、ID番号などの部分一致検索は出来ません。(たとえば「20100615」は、「2010」ではヒットしません。)ただし、アンダースコア( _ )で分割された文字列の場合は、アンダースコアを区切りとして検索ができます。(たとえば「2010_0615」は、「2010」でヒットします。)
たとえば「20100615」は「2010*」や「*0615」でヒットします。
FileBlogファイル名検索の特性
全文検索でヒットしない半角の部分文字列もヒットするように、ファイル名専用の検索インデックスを構築しています。 ファイル名専用インデックスでは、ファイル名を単語分割する際に、文字列長1~15のNグラム方式を取っています。15文字を越えるキーワードで検索する場合、キーワードが一つであればヒットします。
FileBlog全文検索・ファイル名検索 共通の特性
|
Copyright © 2016 Teppi Technology Co. Ltd. All rights reserved.