
solr
文章平均质量分 73
豹先生_MR-BAO
做中国云计算导航人~~~~~
展开
-
Could not append.Requesting close of hlog
上几天跑程序,hadoop集群报了如下错误:2011-08-05 11:57:03,067 DEBUG org.apache.hadoop.hbase.regionserver.HRegion:Started memstore flush forwb_userinfo,sin原创 2011-08-09 19:08:03 · 666 阅读 · 0 评论 -
基于Trie树实现拼音搜索自动补全
原帖:http://itren.diandian.com/archives/104前言目前大多数提供搜索功能的大型网站,都会对用户输入的拼音进行自动补全,推荐一些用户可能感兴趣的词。由于近期自己做的一个项目也要用到此功能,所以打算亲自分析实现一个自动补全功能。需求分析这类应用应当根据不同的场景单独设计,通用的设计未必好用,不过可以择各家之长,按需所取。我的场景是,数据库中存转载 2013-04-01 17:14:23 · 3294 阅读 · 1 评论 -
Solr的自动完成/自动补充实现介绍(第三部分)
原文URL:http://java.dzone.com/news/solr-and-autocomplete-part-3?mz=33057-solr_lucene在之前的两个部分(part1、part2)中,我们学会了如何配置和查询solr来获取自动完成的功能。今天,我们来看一下如果为suggester添加字段,以这种方式来提供自动完成的功能。组件配置在上一期的配置组件中转载 2013-04-01 11:03:25 · 1146 阅读 · 0 评论 -
Solr Performance Factors(solr性能优化因素分析及配置)
Schema Design Considerations(schema配置文件爱你注意事项)indexed fieldsThe number of indexed fields greatly increases the following: Memory usage during indexing Segment merge time Optimization t翻译 2013-09-30 17:09:23 · 2373 阅读 · 0 评论 -
Solr4.3+zookeeper+tomcat 集群部署高可用
当前我使用三台服务器搭建集群分别是192.168.0.18、192.168.0.19、192.168.0.20,其中18为主服务器,19、20为从服务器,并且在20服务器安装zookeeper一、在tomcat7中部署solr41、首先从官网下载solr4.3.1版本到三台服务器(当前的最新版本solr-4.3.1.tgz)2、tar -zxvf solr-4.3.1.tgz (解压s转载 2013-09-18 19:26:46 · 4088 阅读 · 0 评论 -
solr 独立zookeeper集群 SEVERE: null:java.lang.IllegalArgumentException: port out of range:-1 异常处理
异常信息如下:SEVERE: null:java.lang.IllegalArgumentException: port out of range:-1 at java.net.InetSocketAddress.(InetSocketAddress.java:83) at java.net.InetSocketAddress.(InetSocketAddr原创 2013-09-22 16:37:55 · 6834 阅读 · 0 评论 -
solrcloud(solr4)搜索引擎系统架构
New SolrCloud DesignThis was a scratchpad for ideas and was not used as is - this page does not describe theSolrCloud design as it was implemented and this page is only around for historical rea翻译 2013-10-09 11:25:51 · 1909 阅读 · 0 评论 -
solr4 facet 源码流程分析
首先说下solr facet流程中会牵扯到类:1,SearchHandler2,QueryComponent3,FacetComponent4,SolrIndexSearcher1,SearchHandler说明请求处理起始,会调用请求中所有的component,不仅仅是query、facet。2,QueryComponent 3,FacetComponen原创 2013-10-09 19:05:24 · 1346 阅读 · 0 评论 -
Apache Solr实现竞价排名
如果想在solr实现像百度一样相似的竟价的排名,也是可以的,在solr中实现竟价排名,主要使用QueryElevationComponent组件,solrconfig.xml配置:searchComponent name="elevator" class="solr.QueryElevationComponent"> pick a fieldType转载 2013-09-25 09:27:20 · 1685 阅读 · 0 评论 -
性别个性化在淘宝搜索中的应用
2013-08-03阿里技术嘉年华作者:萱然 (一淘及搜索事业部-搜索技术-算法技术-主搜索与商城)背景 作为中国最大的电子商务网站,淘宝上的商品琳琅满目。用户搜索关键词之后会看到成千上万个结果,如何将用户最感兴趣的商品排在前面一直是搜索相关性需要解决的最重要问题之一。 通用排序综合相同关键词下所有用户行为作为排序依据,具有一定的普适性,但这转载 2013-10-14 13:10:43 · 1376 阅读 · 0 评论 -
个性化购买力分析及在搜索排序上应用
2013-08-02阿里技术嘉年华 作者:元涵 (一淘及搜索事业部-搜索技术-算法技术-主搜索与商城)前言 随着网络的流行和互联网信息的爆炸性增长,如何从海量的信息中准确找到自己需要的信息成为了互联网发展面临的一大难题。传统的搜索引擎由于其通用性,对于相同的查询,所有用户得到的都是同样的结果,显然不能满足不同背景、不同目的和不转载 2013-10-14 13:09:58 · 1309 阅读 · 0 评论 -
Solr的自动完成/自动补充实现介绍(第二部分)
原文链接:Solr and Autocomplete (part 2)在Solr的自动完成/自动补充实现介绍(第一部分)中我介绍了怎么用faceting的机制来实现自动完成(autocomplete)的功能,今天我们来看一下如何用Suggester的组件来实现自动完成功能.开始这里有一点需要提醒:Suggest组件在1.4.1或以下版本不可用。要使用这个组件,你需要转载 2013-04-01 11:02:33 · 935 阅读 · 0 评论 -
Solr的自动完成/自动补充实现介绍(第一部分)
转自: http://hankesi2000.iteye.com/blog/1134395大部分人已经见过自动完成(autocomplete)的功能了(见下图),solr提供了构建这个功能的机制。今天,我将给你展示如何使用facet的方式来添加自动完成机制。 索引 设想你想在你的在线商店中,给用户一些提示,比如商品的名称。假设我们的索引构建如下:转载 2013-04-01 11:01:10 · 871 阅读 · 0 评论 -
hbase 根据需求创建组合索引(组合rowkey)及组合索引创建规则
hbase据我目前的了解来看 《查询》方面的最大优势是根据rowkey 进行查询,然后结合map/reduce 运算效率非常高,但是如果牵扯到表关联查询,涉及到列簇中的列时,因为没有索引效率就变的非常低下,所以我这采用了组合索引(组合rowkey)方式来解决这个问题,下面采用简单原创 2011-08-09 20:02:31 · 2049 阅读 · 0 评论 -
java 操作solr api实例 非http请求方式
第一步:在tomcat的conf目录下新建Catalina目录,在Catalina目录下新建localhost目录,在localhost目录下新建solr.xml solr.xml内信息如下: Java代码 "/Volumes/mac转载 2011-09-16 15:25:02 · 4708 阅读 · 1 评论 -
nutch1.3数据流程图
流程入口org.apache.nutch.crawl crawl.java Crawl::run 里面的很多类中都使用了mapreduce框架进行数据处理ulrs:存放在hdfs中的待爬取的urls种子列表Injector:使用mapreduce任务将urls转载 2011-10-10 14:09:54 · 1054 阅读 · 0 评论 -
Nutch 完整安装文档
近来Nutch一词在网络中时有所见,但囿于平常工作繁忙而未能潜心细读与研究,只知道Nutch是Apache组织的一个开源项目,利用它用户可以建立自己内部网的搜索引擎,也可以建立针对整个网络的搜索引擎。好在春节假日期间,终于得空可以从容对其进行一番解读与测试了。在使用Nutch之前转载 2011-10-08 22:10:10 · 909 阅读 · 0 评论 -
win7下在cygwin下安装nutch1.2
将nutch解压缩(.gz后缀,可以直接用winRar解压)后将文件夹nutch-1.2(包含文件夹下所有文件)放置到c:/cygwin/home下(我放在c:/cygwin/home下);打开cygwin,在cygwin环境下进入nutch-1.2目录下(cd /cygdrive/c/cygwin/home/nutch-1.2),使用命令 bin/nutch进行测试,正常的情况下出现的结果是:原创 2011-10-24 22:04:38 · 1174 阅读 · 0 评论 -
Windows下myeclipse 安装 Nutch1.2(终于找到个不报错的)
1.下载并安装cygwin,安装和环境配置不细说了。将%CYGWIN_HOME%\bin加到path中。 2.导入到Eclipse中 ①在Eclipse中添加File > New > Project > Java project。 project name随便,选择 “Create project from existing source” ,在browse中选nutch的解压转载 2011-10-23 22:40:37 · 1436 阅读 · 0 评论 -
win7下cygwin部署nutch1.2报Expecting a line not the end of stream异常
java.io.IOException: Expecting a line not the end of streamat org.apache.hadoop.fs.DF.parseExecResult(DF.java:109)at org.apache.hadoop.util.Shell.runCommand(Shell.java:179)at org.apache.hadoop.u原创 2011-10-24 22:07:47 · 1483 阅读 · 1 评论 -
Java正则表达式详解
如果你曾经用过Perl或任何其他内建正则表达式支持的语言,你一定知道用正则表达式处理文本和匹配模式是多么简单。如果你不熟悉这个术语,那么“正则表达式”(Regular Expression)就是一个字符构成的串,它定义了一个用来搜索匹配字符串的模式。许多语言,包括Perl、PHP、Python、JavaScript和JScript,都支持用正则表达式处理文本,一些文转载 2011-11-15 19:01:15 · 694 阅读 · 0 评论 -
win7下myeclipse部署nutch1.3报Expecting a line not the end of stream异常解决
解决方案同上一篇文章中的nutch1.2异常解决方案相同,跟nutch本身是一点关系都没有原创 2011-10-31 21:45:11 · 177 阅读 · 0 评论 -
基于Solr的LBS(地理位置搜索)实现原理
基于Solr的空间搜索学习笔记在Solr中基于空间地址查询主要围绕2个概念实现:(1) Cartesian Tiers 笛卡尔层Cartesian Tiers是通过将一个平面地图的根据设定的层次数,将每层的分解成若干个网格,如下图所示: 每层以2的评方递增,所以第一层为4个网格,第二层为16 个,所以整个地图的经纬度将在每层的网格中体现:转载 2013-11-08 17:38:57 · 10382 阅读 · 0 评论