
数据挖掘
木棉上的光
公众号:不止于Java
Github:https://github.com/cyxpdc?tab=repositories
邮箱:1142439493@qq.com
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
《数据分析实战》总结三之关联分析算法Apriori+连接分析算法PageRank+常用的数据挖掘算法逻辑回归
1 关联分析算法:Apriori 关联规则挖掘的重要算法:Apriori 关联规则挖掘可以让我们从数据集中发现项与项(item 与 item)之间的关系 概念: 支持度:指的是某个物品在组合中出现的次数与总次数之间的比例。支持度越高,代表这个组合出现的频率越大。 置信度:指的是在 A 发生的情况下,B 发生的概率是多少。 提升度:指的是A的发生对B的发生概率提升的程度。 公式:提升度 (A→B)...原创 2019-10-27 17:05:39 · 2866 阅读 · 0 评论 -
《数据分析实战》总结二之聚类算法:K-Means,EM
1 K-Means K-Means 是一种非监督学习,解决的是聚类问题。 K 代表的是 K 类,Means 代表的是中心,本质是确定 K 类的中心点,当找到了这些中心点,也就完成了聚类。 需要解决三个问题: 1 如何确定 K 类的中心点? 其中包括了初始的设置,以及中间迭代过程中中心点的计算。 在初始设置中,会进行 n_init 次的选择,然后选择初始中心点效果最好的为初始值。 在每次分类更新后...原创 2019-10-27 17:02:44 · 506 阅读 · 0 评论 -
《数据分析实战》总结二之分类算法:决策树,朴素贝叶斯,SVM,KNN,Adaboost
1 决策树 1.1 工作原理 把以前的经验总结出来,最后得到结果 比如打篮球,一般会根据“天气”、“温度”、“湿度”、“刮风”这几个条件来判断,最后得到结果:去打篮球?还是不去? 在做决策树的时候,会经历两个阶段:构造和剪枝。 1.2 构造 构造就是通过选择什么属性作为节点来生成一棵完整的决策树 节点类型: 根节点:就是树的最顶端,最开始的那个节点。在上图中,“天气”就是一个根节点; 内部节...原创 2019-10-27 17:01:20 · 3775 阅读 · 0 评论 -
《数据分析实战》总结一:数据分析基础
1 基本概念 数据挖掘是什么 从一堆数据中通过分析挖掘得到目标需求想要得到的结论 数据挖掘的基本流程 商业理解:数据挖掘的目的是更好地帮助业务,所以要从商业的角度理解项目需求,在这个基础上,再对数据挖掘的目标进行定义。 数据理解:尝试收集部分数据,然后对数据进行探索,包括数据描述、数据质量验证等; 可以对收集的数据有个初步的认知。 数据准备:开始收集数据,并对数据进行清洗、数据集成等操作...原创 2019-10-27 16:51:25 · 1632 阅读 · 3 评论