
机器学习
以实战为线索,逐步深入机器学习原理、应用及各种小操作,掌握其思想,轻松了解机器学习那些事儿。
AI阿聪
日拱一卒无有尽,功不唐捐终入海。一点一滴,慢慢来。
展开
-
手把手图文并茂教你掌握 PageRank 算法
一、PageRank 定义PageRank 算法由 Google 创始人 Larry Page 在斯坦福读大学时提出,又称 PR,佩奇排名。主要针对网页进行排名,计算网站的重要性,优化搜索引擎的搜索结果。PR 值是表示其重要性的因子。...原创 2020-04-17 16:01:24 · 22048 阅读 · 5 评论 -
数据量太少怎么办,请认准交叉验证
一、交叉验证交叉验证是在机器学习建立模型和验证模型参数时常用的办法,一般被用于评估一个机器学习模型的表现。更多的情况下,我们也用交叉验证来进行模型选择(model selection)。交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同的训练集和测试集,某次训练集中的某样本在...原创 2020-04-15 10:25:41 · 16167 阅读 · 4 评论 -
【机器学习实战】科学处理鸢尾花数据集
目录一、案例分析二、数据处理2.1 回答问题2.2 检查数据2.3清理数据2.4 测试数据三、用 scikit-learn 来预测数据3.1选出特征 (输入变量) 和标记 (输出变量)3.2划分训练集和测试集3.3 用模型来学习四、思考题一、案例分析假设我们要创建一个智能手机应用程序,从智能手机拍摄的照片中自动识别花的种类。 我们需创建一个...原创 2020-04-10 16:02:39 · 18727 阅读 · 0 评论 -
【机器学习实战】利用EM聚类算法对王者荣耀英雄进行聚类
目录一、EM算法的步骤二、EM算法的工作原理二、在sklearn中创建GMM模型三、工作流程三、实战环节1. 导包2. 加载数据3. 数据可视化分析4. 特征工程5. 数据规范化6. 建模并产生结果,写入文件7. 显示聚类后的结果8. 聚类结果的评估本篇理论性不多,主要是部分总结及实战内容。一、EM算法的步骤EM算法(英文叫做E...原创 2020-04-03 17:11:32 · 3911 阅读 · 2 评论 -
【机器学习实战】利用KNN和其他分类器对手写数字进行识别
一、在sklearn中创建KNN分类器如果是做分类,你需要引用:from sklearn.neihbors import KNeighborsClassifier 如果是回归, 需要引用:from sklearn.neighbors import KNeighborsRegressorKNeighborsClassifier(n_neighbors=5, weights='uniform'...原创 2020-03-26 18:55:53 · 9900 阅读 · 1 评论 -
【机器学习实战】多项式回归
目录:一、介绍二、多项式回归三、scikit-learn中的多项式回归四、关于PolynomialFeatures五、sklearn中的Pipeline一、介绍直线回归研究的是一个因变量与一个自变量之间的回归问题。多项式回归(Polynomial Regression)研究的是一个因变量与一个或多个自变量间多项式的回归分析方法。多项式回归模型是线性回归模型的一种...原创 2020-03-07 20:28:08 · 1251 阅读 · 0 评论 -
【机器学习实战】数据归一化
一、介绍为什么需要进行数据归一化?举个简单的例子。在下列的散点图中,可知,横轴的值相比于竖轴而言很小,倘若对于一个分类问题,采用KNN算法时求每两个点之间的距离时,倘若数据不归一化的话,因横轴上的数值作用十分小,很容易导致出现严重的误差。因此需要对数据归一化。两种数据归一化的方法:最值归一化(Normalization):把所有数据映射到0-1之间。适用于分布有明显边界...原创 2020-03-07 11:32:27 · 1961 阅读 · 0 评论 -
【机器学习实战】性能指标之回归问题
一、前言我们可以使用各种指标来评估ML算法,分类以及回归算法的性能。我们必须谨慎选择评估ML性能的指标,因为 如何测量和比较ML算法的性能完全取决于您选择的指标。 您如何权衡各种特征在结果中的重要性,将完全取决于您选择的指标。 二、回归问题的性能指标在这里,我们将讨论各种性能指标,这些指标可用于评估回归问题的预测。1.平均绝对误差(MAE)它是用于回归问...原创 2020-03-06 13:46:25 · 1211 阅读 · 0 评论 -
【机器学习实战】线性回归
一、介绍线性回归可以定义为统计模型,用于分析因变量与给定的一组自变量之间的线性关系。变量之间的线性关系意味着,当一个或多个自变量的值更改(增加或减少)时,因变量的值也将相应更改(增加或减少)。数学上的关系可以借助以下方程式来表示:Y = aX + b在这里,Y是我们试图预测的因变量,X是我们用来进行预测的自变量,a是回归线的斜率,b是一个常数,称为截距。1.线性回归的...原创 2020-03-05 20:46:01 · 3474 阅读 · 1 评论 -
白话机器学习之KNN算法
大家好,我是AI阿聪,入门机器学习算法小白。这篇主要讲述机器学习算法之KNN算法。我将从以下几个方面介绍它:KNN介绍,工作流程,示例,用Python实现,KNN优缺点及其应用等。希望大家能 get 它哦!原创 2020-03-05 13:25:38 · 1204 阅读 · 0 评论 -
简单介绍下机器学习入门知识
大家好,这篇文章主要是简单介绍机器学习入门知识,主要从以下几个方面介绍:1. 什么是机器学习、2. 为什么要使用机器学习、3. 机器学习系统的种类(监督/无监督学习、半监督学习、强化学习、批量学习和线上学习、基于实例学习与基于模型学习)、4. 机器学习的重要挑战、 5. 过拟合和欠拟合、 6. 测试和验证、7. 没有免费午餐公理、8. 总结。这些将是学习机器学习算法必备的一些入门知识哦,你也值得一看!原创 2020-02-22 15:07:08 · 872 阅读 · 0 评论