
数据挖掘
木棉上的光
公众号:不止于Java
Github:https://github.com/cyxpdc?tab=repositories
邮箱:1142439493@qq.com
展开
-
《数据分析实战》总结三之关联分析算法Apriori+连接分析算法PageRank+常用的数据挖掘算法逻辑回归
1 关联分析算法:Apriori关联规则挖掘的重要算法:Apriori关联规则挖掘可以让我们从数据集中发现项与项(item 与 item)之间的关系概念:支持度:指的是某个物品在组合中出现的次数与总次数之间的比例。支持度越高,代表这个组合出现的频率越大。置信度:指的是在 A 发生的情况下,B 发生的概率是多少。提升度:指的是A的发生对B的发生概率提升的程度。公式:提升度 (A→B)...原创 2019-10-27 17:05:39 · 2842 阅读 · 0 评论 -
《数据分析实战》总结二之聚类算法:K-Means,EM
1 K-MeansK-Means 是一种非监督学习,解决的是聚类问题。K 代表的是 K 类,Means 代表的是中心,本质是确定 K 类的中心点,当找到了这些中心点,也就完成了聚类。需要解决三个问题:1 如何确定 K 类的中心点?其中包括了初始的设置,以及中间迭代过程中中心点的计算。在初始设置中,会进行 n_init 次的选择,然后选择初始中心点效果最好的为初始值。在每次分类更新后...原创 2019-10-27 17:02:44 · 483 阅读 · 0 评论 -
《数据分析实战》总结二之分类算法:决策树,朴素贝叶斯,SVM,KNN,Adaboost
1 决策树1.1 工作原理把以前的经验总结出来,最后得到结果比如打篮球,一般会根据“天气”、“温度”、“湿度”、“刮风”这几个条件来判断,最后得到结果:去打篮球?还是不去?在做决策树的时候,会经历两个阶段:构造和剪枝。1.2 构造构造就是通过选择什么属性作为节点来生成一棵完整的决策树节点类型:根节点:就是树的最顶端,最开始的那个节点。在上图中,“天气”就是一个根节点;内部节...原创 2019-10-27 17:01:20 · 3736 阅读 · 0 评论 -
《数据分析实战》总结一:数据分析基础
1 基本概念数据挖掘是什么从一堆数据中通过分析挖掘得到目标需求想要得到的结论数据挖掘的基本流程商业理解:数据挖掘的目的是更好地帮助业务,所以要从商业的角度理解项目需求,在这个基础上,再对数据挖掘的目标进行定义。数据理解:尝试收集部分数据,然后对数据进行探索,包括数据描述、数据质量验证等;可以对收集的数据有个初步的认知。数据准备:开始收集数据,并对数据进行清洗、数据集成等操作...原创 2019-10-27 16:51:25 · 1604 阅读 · 3 评论