
solr
小虾米我米
我有我的理想,我相信我的信仰
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
常见中文分词比较
原文出处:http://blog.youkuaiyun.com/aidayei/article/details/6675886 对于英文文档,其分词的过程很简单。中文文本的分类难度较大,主要是因为汉语分词问题的困难,即为此需要建立完整的汉语概念体系、汉语语法、语义和语用分析是十分复杂的。 lucene包自带的三种中文分词:以“我是中国人”这句话作分词举例1.StandardAnalyzer转载 2012-07-02 11:28:45 · 3088 阅读 · 2 评论 -
Solr 使用入门介绍,以搜索论坛帖子为示例
版权信息: 可以任意转载, 转载时请务必以超链接形式标明文章原文出处, 即下面的声明.原文出处:点击打开链接原文还介绍了solr的部署,由于前面我已经有过一篇文章了,所以省略为搜索论坛帖子应用设计索引结构:字段说明id帖子 iduser发表用户名或UserIdtitle标题content内容转载 2012-06-29 17:58:19 · 2659 阅读 · 0 评论 -
Solr搜索引擎 --- windows 下配置solr
一、准备工作:jdk1.5以上,tomcat5.5以上java环境变量配置:变量名:JAVA_HOME 变量值:C:\Program Files\Java\jdk1.7.0变量名:CLASSPATH 变量值:.;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar;变量名:Path 变量值:%JAVA_HOME%\bin;原创 2012-05-16 22:18:03 · 5827 阅读 · 1 评论 -
关于solr不能搜索中文
关于solr不能搜索中文1、需要配置中文分词器,我在此使用的IKAnalyzer分词器,需要jar :IKAnalyzer3.2.8.jarschema.xml 分词配好之后,我们可以再solr的管理页面的[ANALYSIS] 的页面来进行分词测试:这样你输入中华的时候,就可以匹配到 “中华人民原创 2012-08-21 10:45:19 · 5080 阅读 · 1 评论 -
solr 分词之 同义词(synonyms)
我们常常在自定义一些搜索的时候,需要将某些特定的词搜索到其他商品;例如:我搜索 “踩得” 我就要搜索到 “鞋类”那么我们就需要配置solr的同义词:同义词的配置是在 solr的 config文件夹下面:和 schema.xml一个目录下,有一个 synonyms.txt重启solr。继续搜索:这样搜索鞋类,就可以匹配到原创 2013-03-18 16:47:23 · 4120 阅读 · 2 评论 -
IKAnalyzer 扩展词典(强制分词)
前面说到solr+IKAnalyzer来配置中文分词;在实际中我们有些需求是需要将特定的词作为一个分词来处理,那么我们就需要设置自己的词典例子:连帽上衣希望将 “连帽” 作为一个词来处理,并不希望作为 连,帽 来处理默认分词:做法:IKAnalyzer.cfg.xml放到solr的tomcat中:..../webapp/WEB-INF/classes原创 2012-11-13 18:06:16 · 7113 阅读 · 0 评论 -
Solr Suggest实现搜索智能提示
============== 我的配置 ============solrconfig.xml text_spell suggest org.apache.solr.spelling.suggest.Suggester org.apache.solr.spelling.suggest原创 2015-02-06 09:48:35 · 8562 阅读 · 4 评论 -
Solr 删除数据的几种方式
有时候需要删除 Solr 中的数据(特别是不重做索引的系统中,在重做索引期间)。删除一些 Solr 无效数据(或不合格数据)。删除 solr 中的数据有几种方式:1、先来看 curl 方式:curl http://localhost:8080/solr/update --data-binary "title:abc" -H 'Content-type:tex转载 2013-05-10 15:39:16 · 19451 阅读 · 0 评论 -
solr 下载地址
https://archive.apache.org/dist/lucene/solr/原创 2017-01-13 16:52:11 · 660 阅读 · 0 评论