
算法、数据结构/algorithm
Terark-CTO-雷鹏
Terark可检索压缩技术作者。致力于让数据更小,访问更快。
展开
-
对称冗余集群
排好的版粘贴到JavaEye上就乱了,只能截图了,各位抱歉 单点可靠性(Q) 结点数(n) 集群可靠性(F[Q,n,3]) 0.9 5 0.99144 0.9 15 ...2010-03-24 11:28:45 · 210 阅读 · 0 评论 -
count, sum, avg by range in log(n) time
考虑一下这样一个查询: select count(*), sum(tax), avg(weight) from pepole where id >= ${minid} && id < ${maxid}; 怎样才能实现更小的时间复杂度? 一般情况下,最简单的方法就是遍历这个区间。但是这需要O(logn +m)的时间复杂度,其中m是区间长度,n是总...原创 2010-01-04 12:45:42 · 137 阅读 · 0 评论 -
google.sparsetable 实现细节
goolge.sparse*系列容器依赖关系: - sparsetable - sparsehashtable - sparse_hash_map - sparse_hash_set 与现有的一些“标准”实现不同,sparsehash table 使用二次探测法,而不是链接,来解决hash冲突。 sparse table 就更奇特了,...原创 2010-02-08 12:34:51 · 245 阅读 · 0 评论 -
google.sparsegroup 可以更好
sparsegroup 是 google.sparseXXXX (sparsehashmap)系列中最底层的一个数据结构,sparseXXX 的互相依赖如下: -sparsegroup - sparsetable - sparsehashtable - sparse_hash_map - sparse_hash_set 因此,sparsegroup 实现的性...2010-02-22 13:29:00 · 143 阅读 · 0 评论 -
popcount & google.sparsegroup
ubuntu+gcc4.3 ,尝试修改 google.sparsetable 中的 sparsegroup,修改完成,不启用 -mpopcnt,sparsetable_unittest 和 hashtable_unittest 都通过了。启用-mpopcnt以后,发现硬件不支持,报非法指令错误,公司的电脑太烂了! 换到服务器上,是64位至强,gcc4.1.2,启用 -mpopcnt 再加 -O1...2010-02-22 20:35:00 · 132 阅读 · 0 评论 -
服务器超时管理问题
<!--StartFragment--> 问题描述: * 有一个最多能处理N个客户连接的服务器,活跃的连接总是少数; * 为了能够处理更多的连接,需要对每个连接都增加一个超时机制,当总连接数达到N时,某个连接一旦超时,有新的连接请求时,就把超时的关掉,并处理新连接; * 如果总数没有达到N,总是接受新连接; * 每个连接一旦有数据请求,就认为它活跃了...原创 2010-08-19 10:59:11 · 345 阅读 · 0 评论