
大数据
文章平均质量分 75
不碌
做自己喜欢的事
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
MapReduce FileInputFormat读取两个文件顺序
在用mapreduce写电影推荐系统,需求是将两个矩阵合并,但是读取有顺序,因为要先将第一个文件的数据存到数组。 写的时候发现总会先读第二个文件,改了文件目录的先后也没有改变,改了文件大小也没变。 之后我改了文件名称,对了! 原因猜测是读取是按照文件名字符序读取的。 ...原创 2019-11-28 13:31:43 · 453 阅读 · 0 评论 -
Mac hive更换IP地址之后
Mac hive更换IP地址之后 学习hadoop过程中一直在用macos系统在学习,有一个问题是IP地址一直在变化,更换IP之后需要进入/etc更改hosts的IP地址 今天更换IP之后爆出错误 ERROR [ddc658f0-5f45-42af-8383-88f93872c9ce main] ql.Driver: FAILED: HiveAccessControlException Perm...原创 2019-01-18 17:14:45 · 720 阅读 · 1 评论 -
数据挖掘领域十大经典算法之—C4.5算法(超详细附JAVA代码)
直接说一下代码 节点类 一个节点里面包含 no,yes 节点矩阵里结果的数量,比如这个用户买就是yes不买就是no judgeConditions 最后建成决策树代入数据判断条件 比如是0 那么如果数据属性值是0就经过这个节点 classificationNum 这个节点分裂属性类别个数 target 分裂属性的列数 isLeaf 节点是否是叶子节点 class Node{ int no;...原创 2019-06-13 18:47:11 · 1442 阅读 · 0 评论