
海量数据处理
「已注销」
这个作者很懒,什么都没留下…
展开
-
Lucene学习
有关Lucene的使用的两张图: 图一:Lucene建立索引Index和搜索的过程 ------------------------------------------------------------------------------------- 图二:搜索程序的典型组件,其中阴影部分可由Lucene完成原创 2013-06-16 15:39:37 · 1443 阅读 · 0 评论 -
常用负载均衡算法
在服务器集群中,为了避免某一台服务器因过载而崩溃,除了每台服务器限定了最大连接数外,还对服务器的负载进行了均分。本文介绍了几个常见的负载均衡算法。 随机 通过随机数生成算法从服务器组中选取一个,然后把请求发送给它。 轮询 所有的服务器组成一个队列,不管连接数、响应时间,从队列首取出一个,然后放到队尾,不断循环。最终把所有的请求平均分给所有的服务器。适用于服务器性能差异不大的转载 2015-10-11 20:45:22 · 1704 阅读 · 0 评论 -
开源日志系统比较
1. 背景介绍 许多公司的平台每天会产生大量的日志(一般为流式数据,如,搜索引擎的pv,查询等),处理这些日志需要特定的日志系统,一般而言,这些系统需要具有以下特征: (1) 构建应用系统和分析系统的桥梁,并将它们之间的关联解耦; (2) 支持近实时的在线分析系统和类似于Hadoop之类的离线分析系统; (3) 具有高可扩展性。即:当数据量增加时,可以通过增加节点进转载 2016-03-29 20:14:18 · 3249 阅读 · 0 评论