
数据挖掘
QilongPan
这个作者很懒,什么都没留下…
展开
-
关联规则挖掘
关联规则挖掘基本概念(续)定义一:设I={i1,i2,…,im}I={i1,i2,…,im},是m个不同的项目的集合,每个ikik称为一个项目。项目的集合I称为项集。其元素的个数称为项集的长度,长度为k的项集称为k-项集。引例中每个商品就是一个项目,项集为I={bread,beer,cake,cream,milk,tea}I={bread,beer,cake,cream,milk,tea},I的长...转载 2018-06-14 13:42:30 · 851 阅读 · 0 评论 -
ID3、C4.5、CART三种决策树的区别
很早就想写写决策树,说起决策树做过数据挖掘的就不会感觉陌生,但是可能对ID3决策树算法、C4.5决策树算法以及CART决策树之间的区别不太了解,下面就这三个比较著名的决策树算法分别写写决策树是如何工作的一棵决策树包含一个根结点、若干个内部结点和若干个叶结点;叶结点对应于决策结果,其他每个结点则对应一个属性测试;每个结点包含的样本结合根据属性测试的结果被划分到子结点中;根结点包含样本全集,从...转载 2019-02-27 15:44:12 · 302 阅读 · 0 评论 -
hadoop2.7第一个python实例(超详细)
https://blog.youkuaiyun.com/Acecai01/article/details/82722431转载 2019-02-26 18:01:06 · 709 阅读 · 0 评论 -
pandas使用教程
1.read_csv使用https://blog.youkuaiyun.com/zjyklwg/article/details/795565452.drop_duplicates去除重复项使用https://blog.youkuaiyun.com/qq_28811329/article/details/799625113.python中axis=0 axis=1的理解https://blog.c...原创 2019-03-04 13:33:00 · 323 阅读 · 0 评论 -
hadoop生态圈学习
1.Hive导出数据到本地CSVhttps://blog.youkuaiyun.com/gezailushang/article/details/835836212.pyspark读取数据https://blog.youkuaiyun.com/suzyu12345/article/details/79673473#24-%E8%AF%BB%E5%8F%96csv3.hadoop命令https://ww...原创 2019-03-22 16:32:06 · 347 阅读 · 0 评论