
python机器学习
文章平均质量分 93
k近邻算法、朴素贝叶斯算法、决策树算法、随机森林算法、线性回归、逻辑回归、特征工程
立Sir
专注于深度学习、机器视觉,代码涉及Python、TensorFlow、Pytorch。感谢各位支持,已毕业,断更。
展开
-
【机器学习入门】(13) 实战:心脏病预测,补充: ROC曲线、精确率--召回率曲线,附python完整代码和数据集
各位同学好,经过前几章python机器学习的探索,想必大家对各种预测方法也有了一定的认识。今天我们来进行一次实战,心脏病病例预测,本文对一些基础方法就不进行详细解释,有疑问的同学可以看我前几篇机器学习文章。文末有完整代码和数据集。1. 数据获取首先导入数据处理所需要的库文件,再导入心脏病病例数据,使用 .info() 函数检查数据集中是否存在缺失值,本数据集不存在缺失值。数据集获取:链接:百度网盘 请输入提取码提取码:a9wlimport pandas as pdimport matp.原创 2021-11-21 20:15:20 · 14988 阅读 · 13 评论 -
【机器学习入门】(12) 特征工程:特征选择、数据降维、PCA
各位同学好,今天我和大家分享一下python机器学习中的 特征选择、数据降维、PCA等方法原创 2021-11-21 09:45:57 · 2191 阅读 · 0 评论 -
【机器学习入门】(11) 特征工程:特征预处理,归一化、标准化、处理缺失值
各位同学好,今天我和大家分享一下python机器学习中的特征与处理。内容有:(1)归一化、(2)标准化、(3)处理缺失值那我们开始吧。特征预处理采用的是特定的统计方法(数学方法)将数据转化为算法要求的数字1. 数值型数据归一化,将原始数据变换到[0,1]之间标准化,数据转化到均值为0,方差为1的范围内 缺失值,缺失值处理成均值、中位数等2. 类别型数据降维,多指标转化为少数几个综合指标,去掉关联性不大的指标PCA,降维的一种3. 时间类别时间的切分1...原创 2021-11-20 19:51:01 · 2466 阅读 · 0 评论 -
【机器学习入门】(10) 特征工程:特征抽取,字典特征抽取、文本特征抽取,附完整python代码
各位同学好,今天和大家介绍一下python机器学习中的特征工程。在将数据放入模型之前,需要对数据的一些特征进行特征抽取,方法有:(1) 字典特征抽取DictVectorizer(),(2) 文本特征抽取(英文单词、中文字词)CountVectorizer(),(3) tf-idf 文本抽取TfidfVectorizer()由于模型训练函数.fit() 函数只能传入数值类型的特征值,因此我们需要将特征值中的文本类型转换成数值类型。1. 字典特征抽取导入方法:from sklearn...原创 2021-11-20 17:25:00 · 3164 阅读 · 1 评论 -
【机器学习入门】(9) 逻辑回归算法:原理、精确率、召回率、实例应用(癌症病例预测)附python完整代码和数据集
各位同学好,今天我和大家分享一下python机器学习中的逻辑回归算法。内容主要有:(1) 算法原理;(2) 精确率和召回率;(3) 实例应用--癌症病例预测。文末有数据集和python完整代码1. 概念理解逻辑回归,简称LR,它的特点是能够将我们的特征输入集合转化为0和1这两类的概率。一般来说,回归不用在分类问题上,但逻辑回归却能在二分类(即分成两类问题)上表现很好。逻辑回归本质上是线性回归,只是在特征到结果的映射中加入了一层Sigmod函数映射,即先把特征线形求和,然后使用Sigmoi原创 2021-11-20 11:44:52 · 7469 阅读 · 4 评论 -
【机器学习入门】(8) 线性回归算法:正则化、岭回归、实例应用(房价预测)附python完整代码和数据集
各位同学好,今天我和大家分享一下python机器学习中线性回归算法的实例应用,以及正则化和岭回归。在上一篇文章中我介绍了线性回归算法的原理及推导过程本节中我将借助Sklearn库完成波士顿房价预测,带大家进一步学习线性回归算法。1. Sklearn 库实现1.1 线性回归方法选择(1)正规方程的线性回归导入方法: from sklearn.linear_model import LinearRegression...原创 2021-11-18 20:55:01 · 4708 阅读 · 1 评论 -
【机器学习入门】(7) 线性回归算法:原理、公式推导、损失函数、似然函数、梯度下降
各位同学好,今天我和大家分享一下python机器学习中的线形回归算法。内容有:(1) 线性回归方程、(2) 损失函数推导、(3) 似然函数、(4) 三种梯度下降方法1.概念简述线性回归是通过一个或多个自变量与因变量之间进行建模的回归分析,其特点为一个或多个称为回归系数的模型参数的线性组合。如下图所示,样本点为历史数据,回归曲线要能最贴切的模拟样本点的趋势,将误差降到最小。2. 线性回归方程线形回归方程,就是有 n 个特征,然后每个特征Xi都有相应...原创 2021-11-18 18:25:35 · 10138 阅读 · 0 评论 -
【机器学习入门】(6) 随机森林算法:原理、实例应用(沉船幸存者预测)附python完整代码和数据集
今天我和大家分享一下python机器学习的随机森林算法。主要内容有:(1) 算法原理、(2) sklearn实现随机森林、(3) 泰坦尼克号沉船幸存者预测。文末附python完整代码和数据集。那我们开始吧。原创 2021-11-17 19:21:14 · 13668 阅读 · 1 评论 -
【机器学习入门】(5) 决策树算法实战:sklearn实现决策树,实例应用(沉船幸存者预测)附python完整代码及数据集
python机器学习中的决策树算法,上一节中我介绍了决策树算法的基本原理,这一节,我将通过实例应用沉船幸存者预测,带大家进一步认识这个算法。文末有完整代码和数据集,需要的自取。那我们开始吧。【机器学习】(4) 决策树算法理论:算法原理、信息熵、信息增益、预剪枝、后剪枝、算法选择1. Sklearn实现决策树首先我来介绍一下sklearn库中的决策树分类器sklearn.tree.DecisionTreeClassifier导入方法: from sklearn.tree imp.原创 2021-11-17 15:37:28 · 6435 阅读 · 1 评论 -
【机器学习入门】(4) 决策树算法理论:算法原理、信息熵、信息增益、预剪枝、后剪枝、算法选择
python机器学习中的决策树算法的基本原理。内容主要有:(1) 概念理解;(2) 信息熵;(3) 信息增益;(4) 算法选择;(5) 预剪枝和后剪枝。python决策树算法案例实战我在下一篇文章中介绍。那我们开始吧。1. 决策树概念通过不断的划分条件来进行分类,决策树最关键的是找出那些对结果影响最大的条件,放到前面。原创 2021-11-17 11:00:22 · 2845 阅读 · 2 评论 -
【机器学习入门】(3) 朴素贝叶斯算法:多项式、高斯、伯努利,实例应用(心脏病预测)附python完整代码及数据集
朴素贝叶斯算法的多项式模型、高斯模型、伯努利模型,案例实战:心脏病预测,对比多项式模型和高斯模型的准确率,附python完整代码和数据集原创 2021-11-16 20:36:59 · 6190 阅读 · 1 评论 -
【机器学习入门】(2) 朴素贝叶斯算法:原理、实例应用(文档分类预测)附python完整代码及数据集
各位同学好,今天我向大家介绍python机器学习中的朴素贝叶斯算法。内容有:算法的基本原理;案例实战--新闻文档的分类预测。案例简介:新闻数据有20个主题,有10万多篇文章,每篇文章对应不同的主题,要求是任意输入一篇新的文章,模型输出这篇文章属于哪个主题。1. 算法原理1.1 朴素贝叶斯方法朴素贝叶斯方法涉及一些概率论知识,我们先来复习一下。联合概率:包含多个条件,并且所有的条件同时成立的概率,公式为:条件概率:事件A在另一个事件B已经发生的前提下发生的概率,记作P(A|B),如果有原创 2021-11-15 11:29:09 · 7226 阅读 · 2 评论 -
【机器学习入门】(1) K近邻算法:原理、实例应用(红酒分类预测)附python完整代码及数据集
各位同学好,今天我向大家介绍一下python机器学习中的K近邻算法。内容有:K近邻算法的原理解析;实战案例--红酒分类预测。红酒数据集、完整代码在文章最下面。那我们开始吧。1. K近邻算法介绍1.1 算法原理 原理:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,那么该样本也属于这个类别。简单来说就是,求两点之间的距离,看距离谁是最近的,以此来区分我们要预测的这个数据是属于哪个分类。 我们看图来理解一下。蓝色点是属于a类型的样...原创 2021-11-14 16:25:17 · 11570 阅读 · 5 评论