排重记录

主要是针对论坛上的主题转载的过多,所以做个排重

5000条主题排重

以我破机器跑70秒左右,估计到p4 2.8 2g内存服务器上跑大概一半时间吧

没想出精确的算法, 粗略算法正确性还行。

先将就用着,改天有更好的再来修改

1条到5000条不同主题比较,大概100多ms,嘿嘿,懒得用啥算法,最原始的,够用,速度不够再优化吧,比前者好有大概思路的

折腾其他东西去
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值