- 博客(12)
- 收藏
- 关注
转载 SimHash-大数据文本去重的方法之一
目录[-]1、Simhash 算法简介2、算法几何意义和原理3、比较相似度4、示例代码:5、适用场景:REF:传统的 hash 算法只负责将原始内容尽量均匀随机地映射为一个签名值,原理上相当于伪随机数产生算法。产生的两个签名,如果相等,说明原始内容在一定概 率 下是相等的;如果不相等,除了说明原始内容不相等外,不再提供任何信息,因为即使原始内容只相差
2014-04-15 10:04:09
5216
转载 tomcat 调优
从“第三天”的性能测试一节中,我们得知了决定性能测试的几个重要指标,它们是:ü 吞吐量ü Responsetimeü Cpuloadü MemoryUsage我 们也在第三天的学习中对Apache做过了一定的优化,使其最优化上述4大核心指标的读数,那么我们的Apache调优了,我们的Tomcat也作些相应 的调整,当完成今的课程后,到时你的“
2014-04-08 15:15:35
1176
1
转载 JVM性能调优监控工具jps、jstack、jmap、jhat、jstat、hprof使用详解
现实企业级Java开发中,有时候我们会碰到下面这些问题:OutOfMemoryError,内存不足内存泄露线程死锁锁争用(Lock Contention)Java进程消耗CPU过高...... 这些问题在日常开发中可能被很多人忽视(比如有的人遇到上面的问题只是重启服务器或者调大内存,而不会深究问题根源),
2014-04-08 14:46:44
588
转载 Tomcat性能调优
JVM参数调优是个很头痛的问题,设置的不好,JVM不断执行Full GC,导致整个系统变得很慢,网站停滞时间能达10秒以上,这种情况如果没隔几分钟就来一次,自己都受不了。这种停滞在测试的时候看不出来,只有网站pv达到数十万/天的时候问题就暴露出来了。要想配置好JVM参数,需要对年轻代、年老代、救助空间和永久代有一定了解,还要了解jvm内存管理逻辑,最终还要根据自己的应用来做调整。关于JVM
2014-04-04 19:52:38
754
转载 浅谈REDIS数据库的键值设计
丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样,DEV和DBA需要深度沟通,review每行sql语句,也不像memcached那样,不需要DBA的参与。redis的DBA需要熟悉数据结构,并能了解使用场景。下面举一些常见适合kv数据库的例子来谈谈键值的设计,并与关系型数据库做一个对比,发现关系型的不足之处。用户登录系统记录用户登录信息的一个系统, 我们简化业务
2014-04-02 00:02:49
776
转载 redis 示例 (一)
Jedis 是Redis 的Java客户端,通过一段时间的使用,jedis基本实现redis的所有功能,并且jedis在客户端实现redis数据分片功能,Redis本身是没有数据分布功能。一、下载jedis 代码jedis 代码地址:https://github.com/xetorthio/jedis再次感受到开源的强大。呵呵,大家有时间可以看看源码。二、项
2014-03-30 00:12:33
651
转载 Redis测试_推荐pipeline
测试环境 Redis测试版本:2.2.12 使用Java Jedis客户端进行测试 测试数据量:50万, 超过2亿 速度 1) mset函数插入效率最高,插入Redis的速度达到20万条数据/秒。但是该函数所耗内存较高,对于我们实际应用一表每天2.4亿的数据量来说,需要消耗近32G内存; 2) mset函数中当m值达到200以上时,插入速度接近饱和,因此实际应用中,应设
2014-03-29 23:35:47
1066
转载 Linux下配置jdk1.7
第一步:下载jdk-7-linux-i586.tar.gzwget -c http://download.oracle.com/otn-pub/java/jdk/7/jdk-7-linux-i586.tar.gz (注:如果下载不下来,建议使用迅雷下载,然后拷贝到Linux系统上。) 第二步:解压安装sudo tar
2014-03-29 22:33:17
469
原创 Linux系统手动安装rzsz 软件包
1. wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz 下载2 . 解压 tar -zxvf rzsz-3.34.tar.gz3. make posix[root@web1 rzsz]# make Please study the #ifdef's in crctab.c, rbsb.c
2014-03-29 22:31:27
618
转载 使用Redis bitmaps进行快速、简单、实时统计
原文:Fast, easy, realtime metrics using Redis bitmaps (http://blog.getspool.com/2011/11/29/fast-easy-realtime-metrics-using-redis-bitmaps/) getspool.com的重要统计数据是实时计算的。Redis的bitmap让我们可以
2014-03-28 17:43:15
1568
转载 R树空间索引
R树空间索引[转 :http://blog.youkuaiyun.com/zhouxuguang236/article/details/7898272]R树在数据库等领域做出的功绩是非常显著的。它很好的解决了在高维空间搜索等问题。举个R树在现实领域中能够解决的例子吧:查找20英里以内所有的餐厅。如果没有R树你会怎么解决?一般情况下我们会把餐厅的坐标(x,y)分为两个字段存放在数据库中,
2014-03-25 23:57:53
561
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人