
机器学习笔记
努力努力再努力F_
这个作者很懒,什么都没留下…
展开
-
《Hands-On Machine Learning with Scikit-Learn and TensorFlow》 学习笔记第一篇----综述
一、机器学习基础(使用工具sklearn)机器学习定义,主要的一些概念,主要挑战一个完整的机器学习项目包含哪些内容## 标题数据+模型 缺一不可数据方面:数据预处理,特征选择,数据可视化模型方面:选择算法适配数据,评估模型,(交叉验证,过拟合/欠拟合,学习/验证曲线,各种精度指标),模型参数选择一些补充概念核外学习概念:处理计算机内无法应对大量数据,将数据分为小批量,然后使用...原创 2019-06-15 08:41:35 · 436 阅读 · 0 评论 -
《Hands-On Machine Learning with Scikit-Learn and TensorFlow》 学习笔记第二篇----端到端的机器学习
回归模型例子一、架构问题,关注蓝图确定机器学习的类型,监督还是无监督,分类还是回归,批量学习还是在线学习。选择误差衡量指标,回归模型常见的是均方根误差(RMSE)RMSE与MAE区别当有很多离群区域时, 你可以考虑使用平均绝对误差(也称为平均绝对偏差)RMSE对应L2范数,MAE对应L1范数范数指数越高,则越关注大的价值,忽视小的价值。RMSE比MAE对异常值更敏感。但是当异常...原创 2019-06-16 21:10:09 · 1079 阅读 · 1 评论 -
《Hands-On Machine Learning with Scikit-Learn and TensorFlow》 学习笔记第三篇----分类模型
从tensorflow下载mnist数据import tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_datamnist=input_data.read_data_sets(’/content’,one_hot=True)解压mnist数据原创 2019-06-17 21:09:27 · 995 阅读 · 0 评论 -
《Hands-On Machine Learning with Scikit-Learn and TensorFlow》 学习笔记第四篇----训练模型和评估模型
一、训练模型方法我们介绍两种非常不同的训练模型的方法,通过“闭式”方程——直接计算出最适合训练集的模型参数(也 就是使训练集上的成本函数最小化的模型参数)。使用迭代优化的方法,即梯度下降(GD),逐渐调整模型参数直至训练集上的成本函数调至最低,最终趋同于第一种方法计算出来的模型参数。我们还会研究几个梯度下降的变体,包括批量梯度下降、小批量梯度下降以及随机梯度下降。二、梯度下降梯度下...原创 2019-06-21 08:49:18 · 1568 阅读 · 0 评论 -
《Hands-On Machine Learning with Scikit-Learn and TensorFlow》 学习笔记第五篇----正则线性模型
对线性模型来说,正则化通常通过约束模型的权重来实现。接下来我们将会使用岭回归(Ridge Regression)、套索回归(LassoRegression)及弹性网络(Elastic Net)这三种不同的实现方法对权重进行约束。一、岭回归(Ridge Regression)岭回归(也叫作吉洪诺夫正则化)是线性回归的正则化版:在成本函数中添加一个等于 的正则项。这使得学习中的算法不仅需要拟合数据...原创 2019-06-23 15:52:34 · 168 阅读 · 0 评论 -
《Hands-On Machine Learning with Scikit-Learn and TensorFlow》 学习笔记第六篇----机器学习中的降维方法
文章目录降维的意义数据降维方法投影流形学习数据降维主要技术PCA增量PCAKernal PCALLE降维的意义许多机器学习问题涉及训练实例的几千甚至上百万个特征,这不仅导致训练非常缓慢, 也让我们更加难以找到好的解决方案。 这个问题通常被称为维度的诅咒,所以有效的减少特征的数量会提高效率,加快训练。降维对于数据可视化也是非常有用的。 将维度降到两个(或三个) , 就可以在图形上绘制出高维训练集...原创 2019-07-03 09:03:32 · 528 阅读 · 0 评论