
机器学习
高雅_GaoYa
一个励志成为优秀分析师的孩纸
展开
-
机器学习笔记--5、决策树及python实现
决策树文章目录决策树决策树的概念属性选择的先后顺序纯度基尼系数熵(entropy)信息增益(gain)错误率(classification error)sklearn中的决策树决策树的概念决策树是一种树形结构的分类器,通过顺序询问分类点的属性决定分类点最终的类别。通常根据特征的信息增益或其他指标,构建一颗决策 树。在分类时,只需要按照决策树中的结点依次进行判断,即可得到样本所属类别。 例如,...原创 2020-04-28 17:38:19 · 1272 阅读 · 2 评论 -
机器学习笔记--4、朴素贝叶斯及python实现
朴素贝叶斯文章目录朴素贝叶斯概率基础随机事件样本空间概率联合概率条件概率独立性全概率公式贝叶斯公式朴素贝叶斯拉普拉斯平滑处理算法处理流程sklearn中的朴素贝叶斯高斯朴素贝叶斯python实现高斯朴素贝叶斯多项式朴素贝叶斯——用于文本分类朴素贝叶斯模型(Naive Bayesian Model,NBM)朴素贝叶斯分类器是一个以贝叶斯定理为基础 的多分类的分类器。 对于给定数据,首先基于特征...原创 2020-04-27 23:14:16 · 1854 阅读 · 0 评论 -
机器学习笔记--3、分类学习KNN及python实现
KNN文章目录KNN什么是KNN计算步骤1. 算距离2. 找邻居3. 做分类算法流程KNN的优点与缺点优点缺点python实现什么是KNNkNN(k-Nearest Neighbor Classification),即K-近邻分类算法近朱者赤,近墨者黑一个样本在特征空间中,总会有k个最相似(即特征空间中最邻近)的样本。其中,大多数样本属于某一个类别,则该样本也属于这个类别。是理...原创 2020-04-27 19:21:25 · 1194 阅读 · 0 评论 -
机器学习笔记--2、回归分析及python实现
回归分析文章目录回归分析线性模型(linear model)获得线性模型线性模型的基本形式线性回归目标函数(单变量)目标函数(多变量)python实现线性回归示例线性模型(linear model)线性linear,指量与量之间按比例、成直线的关系,在空间和时间上代表规则和光滑的运动,一阶导数为常数;非线性non-linear则指不按比例、不成直线的关系,代表不规则的运动和突变,一阶导数不...原创 2020-04-27 18:45:43 · 1915 阅读 · 2 评论 -
机器学习笔记--1、认识机器学习
机器学习的概念致力于研究如何通过计算的手段,利用经验(历史数据)来改善系统自身的性能[机器学习]。从数据中产生模型的算法,即“学习算法”。机器学习相关的基本术语•学习(训练):从数据中学得模型的过程•训练集:参与模型训练的样本集合•测试:学得模型后,使用其样本进行预测的过程•测试集:被预测的样本集合•假设:学得模型对应的关于数据的某种潜在规律•分类:输出结果是离散值•回归:输出...原创 2020-04-27 17:28:58 · 730 阅读 · 0 评论 -
fit_transform,fit,transform区别和作用详解
fit_transform,fit,transform区别和作用详解写在前面:fit和transform没有任何关系,仅仅是数据处理的两个不同环节,之所以出来fit_transform这个函数名,仅仅是为了写代码方便,会高效一点。sklearn里的封装好的各种算法使用前都要fit,fit相对于整个代码而言,为后续API服务。fit之后,然后调用各种API方法,transform只是其...转载 2020-04-26 19:53:35 · 1041 阅读 · 0 评论 -
利用python对一份AQI数据进行分析与预测
AQI分析与预测文章目录AQI分析与预测1、 读取数据1.1 导入相关的库1.2 加载数据集2、 数据清洗2.1 缺失值2.1.2 缺失值处理2.1.2 数据分布2.1.3 填充数据2.2 异常值2.2.1 异常值探索2.2.1.1 describle方法2.2.1.2 3σ方法2.2.1.3 箱线图2.2.2 异常值处理2.2.2.1 对数转换2.2.2.2 使用边界值替换2.2.2.3 分箱...原创 2020-04-16 20:48:27 · 5496 阅读 · 13 评论