[url]http://lucene.apache.org/solr/tutorial.html[/url]
Text Analysis
Example queries demonstrating relevancy improving transformations:
* A search for [b]power-shot[/b] matches [b]PowerShot[/b], and [b]adata[/b] matches [b]A-DATA[/b] due to the use of WordDelimiterFilter and LowerCaseFilter.
可以通过WordDelimiterFilter去除字符间的分割符
LowerCaseFilter 取消大小写区分。这2个filter对中文搜索没什么大的意义。
* A search for [b]name:printers[/b] matches [b]Printer[/b], and features:[b]recharging[/b] matches [b]Rechargeable[/b] due to stemming with the [b]EnglishPorterFilter[/b].
EnglishPorterFilter 英文单词近似。中文没用。
* A search for "[b]1 gigabyte[/b]" matches things with [b]GB[/b], and [b]pixima[/b] matches [b]Pixma[/b] due to use of a [b]SynonymFilter[/b].
同义词管理,这个对中文搜索还是有意义的。
Text Analysis
Example queries demonstrating relevancy improving transformations:
* A search for [b]power-shot[/b] matches [b]PowerShot[/b], and [b]adata[/b] matches [b]A-DATA[/b] due to the use of WordDelimiterFilter and LowerCaseFilter.
可以通过WordDelimiterFilter去除字符间的分割符
LowerCaseFilter 取消大小写区分。这2个filter对中文搜索没什么大的意义。
* A search for [b]name:printers[/b] matches [b]Printer[/b], and features:[b]recharging[/b] matches [b]Rechargeable[/b] due to stemming with the [b]EnglishPorterFilter[/b].
EnglishPorterFilter 英文单词近似。中文没用。
* A search for "[b]1 gigabyte[/b]" matches things with [b]GB[/b], and [b]pixima[/b] matches [b]Pixma[/b] due to use of a [b]SynonymFilter[/b].
同义词管理,这个对中文搜索还是有意义的。
本文介绍了如何使用Solr进行高效搜索,包括通过WordDelimiterFilter和LowerCaseFilter去除字符间分割符并取消大小写区分,利用EnglishPorterFilter进行英文单词近似处理以实现词干还原,以及采用SynonymFilter进行同义词管理等技术手段。
1196

被折叠的 条评论
为什么被折叠?



