
数据挖掘
QilongPan
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
关联规则挖掘
关联规则挖掘基本概念(续)定义一:设I={i1,i2,…,im}I={i1,i2,…,im},是m个不同的项目的集合,每个ikik称为一个项目。项目的集合I称为项集。其元素的个数称为项集的长度,长度为k的项集称为k-项集。引例中每个商品就是一个项目,项集为I={bread,beer,cake,cream,milk,tea}I={bread,beer,cake,cream,milk,tea},I的长...转载 2018-06-14 13:42:30 · 884 阅读 · 0 评论 -
ID3、C4.5、CART三种决策树的区别
很早就想写写决策树,说起决策树做过数据挖掘的就不会感觉陌生,但是可能对ID3决策树算法、C4.5决策树算法以及CART决策树之间的区别不太了解,下面就这三个比较著名的决策树算法分别写写 决策树是如何工作的 一棵决策树包含一个根结点、若干个内部结点和若干个叶结点;叶结点对应于决策结果,其他每个结点则对应一个属性测试;每个结点包含的样本结合根据属性测试的结果被划分到子结点中;根结点包含样本全集,从...转载 2019-02-27 15:44:12 · 313 阅读 · 0 评论 -
hadoop2.7第一个python实例(超详细)
https://blog.youkuaiyun.com/Acecai01/article/details/82722431转载 2019-02-26 18:01:06 · 725 阅读 · 0 评论 -
pandas使用教程
1.read_csv使用 https://blog.youkuaiyun.com/zjyklwg/article/details/79556545 2.drop_duplicates去除重复项使用 https://blog.youkuaiyun.com/qq_28811329/article/details/79962511 3.python中axis=0 axis=1的理解 https://blog.c...原创 2019-03-04 13:33:00 · 341 阅读 · 0 评论 -
hadoop生态圈学习
1.Hive导出数据到本地CSV https://blog.youkuaiyun.com/gezailushang/article/details/83583621 2.pyspark读取数据 https://blog.youkuaiyun.com/suzyu12345/article/details/79673473#24-%E8%AF%BB%E5%8F%96csv 3.hadoop命令 https://ww...原创 2019-03-22 16:32:06 · 365 阅读 · 0 评论