
数据挖掘
liuzx32
这个作者很懒,什么都没留下…
展开
-
经典的FP-Growth算法
经典FP-Growth算法1.背景:众所周知,Apriori算法在产生频繁模式完全集前需要对数据库进行多次扫描,同时产生大量的候选频繁集,这就使Apriori算法时间和空间复杂度较大。但是Apriori算法中有一个很重要的性质:频繁项集的所有非空子集都必须也是频繁的。由此性质,引出了FP-Growth算法。2.算法说明首先介绍FP-Growth算转载 2012-06-11 15:05:39 · 936 阅读 · 0 评论 -
HBase与MongoDB的区别(1)
1、HBase依赖于HDFS;MongoDB直接存储在本地磁盘中。2、HBase按照列族将数据存储在不同的文件中;MongoDB不分列,整个文档都存储在一个(或者说一组)文件中,通过一个有一个通用的.ns文件保存名称空间(Column-based和Document-Based之间的区别应该是指这个地方吧)。即HBase是列式存储而MongoDB是文档存储3、HBase一个region只有一转载 2013-02-20 09:43:13 · 947 阅读 · 0 评论 -
MongoDB与HBase的区别(2)
1.Mongodb bson文档型数据库,整个数据都存在磁盘中,hbase是列式数据库,集群部署时每个familycolumn保存在单独的hdfs文件中。2.Mongodb 主键是“_id”,主键上面可以不建索引,记录插入的顺序和存放的顺序一样,hbase的主键就是row key,可以是任意字符串(最大长度是 64KB,实际应用中长度一般为 10-100bytes),在hbase内部,ro转载 2013-02-20 09:45:42 · 1015 阅读 · 0 评论