
搜索引擎相关
escaflone
这个作者很懒,什么都没留下…
展开
-
Solr笔记(1)_概况
一、简洁 Solr是一个开源的,企业级搜索服务器。她已经是一个成熟的产品,用于强化网络站点的搜索功能,包括内部局域网。她是用Java语言编写。使用HTTP和XML进行数据传输,Java的掌握对于学习Solr不是必须的。除了能返回搜索结果外,还有包括高亮搜索关键字,方位导航(已广泛用于电子商务网站),查询关键字拼写校验,自动查询建议和 “类似”查询 帮助更好定位搜索。二、Lucene,solr的基础引擎 在相信介绍Solr前,我们先从Apache Lucene开始,Solr的核心基础引原创 2010-07-08 11:20:00 · 7928 阅读 · 4 评论 -
Solr笔记(2)_Schema.xml和solrconfig.xml分析
现在我们开始研究载入的数据部分(importing data)在正式开始前,我们先介绍一个存储了大量音乐媒体的网站http://musicbrainz.org ,这里的数据都是免费的,一个大型开放社区提供。MusicBrainz每天都提供一个数据快照(snapshot)的SQL文件,这些数据可以被导入PostgreSQL数据库中。一、索引。我们需要做的就是 对不同的文档类型定义不同的fields,然后使用field来辨别type。一个field在所有的的文档中应该是唯一的。原创 2010-07-11 00:19:00 · 25900 阅读 · 5 评论 -
Solr在TomCat下的使用 和 运行多个Solr
一、在Tomcat中安装运行Solr 下载Solr包,找到dist文件夹中的appache-solr-1.4.0.war。将它拷贝到tomcat的webapps下,改名为solr.war(之后访问的路径为/solr)。在webapp下建立同war包名一样的文件夹(这里就是solr),将example/solr下的所有文件拷贝到这个目录下(这里是一些样例的配置)在tomcat的conf/Catalina/localhost文件夹下面建立solr.xml,设定solr的根目录。原创 2010-07-11 13:02:00 · 5317 阅读 · 0 评论 -
solr_对富文本(pdf等)建立索引
solrconfig.xml中定义的last_modifiedignored_/my/path/to/tika.config原创 2010-08-16 15:31:00 · 8416 阅读 · 0 评论 -
Solr_stopword相关注意事项
<br />So in Solr, normally we’re used to stopwords just kind of magically working. If you enter a stop word in a query, it’ll just be silently ignored and stripped out (unlike my legacy OPAC, which will give you zero results whenever you include a stopword转载 2010-09-07 13:54:00 · 2600 阅读 · 0 评论