
机器学习基础
X1AO___X1A
这个作者很懒,什么都没留下…
展开
-
机器学习 | 目录(持续更新)
侠的机器学习笔记使用博客来记录自己的机器学习过程,笔记是通过网络、书籍以及自我总结而成的。本笔记分为三部分:机器学习基础监督学习算法非监督学习算法所有已完成的笔记都会发布到 优快云 Blog 上,感兴趣的小伙伴可以关注一下,我将会坚持更新机器学习以及深度学习的笔记。所有的笔记都是由 Jupyter Notebook 写成的,Notebook 可以在这个 Github 库内找到。...原创 2019-08-17 12:47:21 · 2283 阅读 · 0 评论 -
机器学习 | 特征缩放
文章目录1. 特征缩放1.1 最大最小值归一化(min-max normalization)sklearn.preprocessing.MinMaxScaler1.2 均值归一化(mean normalization)1.3 中心化(mean centering)1.4 标准化 / z值归一化(standardization / z-score normalization)sklearn.prep...转载 2019-09-10 00:19:17 · 919 阅读 · 0 评论 -
机器学习 | 距离计算
文章目录距离计算1. 闵可夫斯基距离(连续属性、有序属性)1.1 曼哈顿距离1.2 欧氏距离2. VDM 距离(无序属性)3. MinkovDM 距离(混合属性)4. 加权距离(重要性不同)参考资料距离计算对函数 dist(⋅,⋅)dist(\cdot,\cdot)dist(⋅,⋅) ,若它是一个“距离度量”(distance measure),则需满足一些基本性质:[1](1)非负性:di...原创 2019-09-07 11:24:53 · 2364 阅读 · 0 评论 -
机器学习 | 聚类评估指标
文章目录1. 聚类评估指标1.1 外部评估指标RI 兰德指数ARI 调整兰德指数Jaccard JC指数FMI FMI指数MI 互信息NMI 归一化互信息AMI 调整互信息1.2 内部评估指标DBI 戴维森堡丁指数DI Dunn指数SC 轮廓系数参考文献1. 聚类评估指标Clustering performance evaluation聚类性能度量亦称聚类“有效性指标”(validity i...原创 2019-09-05 00:05:08 · 5305 阅读 · 0 评论 -
机器学习 | 梯度下降原理及Python实现
文章目录1. 梯度下降1.1 批量梯度下降(BGD)1.1.1 学习率的设置1.1.2 Python 实现 BGD1.2 随机梯度下降(SGD)1.2.1 Python 实现 SGD1.2.2 Sklearn 实现 SGD1.3 小批量随机下降(MBGD)2. 三类梯度下降的比较参考资料相关文章:机器学习 | 网络搜索及可视化监督学习 | 线性回归原理及Sklearn实现1. 梯度下降梯...原创 2019-08-14 01:49:30 · 3118 阅读 · 0 评论 -
机器学习 | 网络搜索及可视化
文章目录1. 网络搜索1.1 简单网络搜索1.2 参数过拟合的风险与验证集1.3 带交叉验证的网络搜索1.3.1 Python 实现1.3.2 Sklearn 实现1.4 网络搜索可视化1.4.1 在网络空间中的搜索1.4.1.1 错误的参数设置和可视化1.4.2 在非网络空间的搜索参考资料1. 网络搜索网络搜索(Grid Search):一种调参方法,利用穷举搜索,在所有候选的参数选择中,通...原创 2019-08-11 22:03:13 · 5425 阅读 · 0 评论 -
机器学习 | 模型选择
文章目录1. 模型验证1.1 错误的模型验证方法1.2 正确的模型验证方法1.2.1 留出集1.2.2 交叉验证1.2.3 K折交叉验证1.2.4 留一法 LOO2. 偏差-方差2.1 泛化误差、偏差及方差2.2 泛化误差与偏差及方差的关系3. 拟合程度3.1 欠拟合与过拟合3.2 影响拟合程度的因素3.3 模型复杂度2.3.1 模型复杂度图表3.3.2 验证曲线3.3.2.1 Sklearn 验...原创 2019-08-10 21:40:19 · 951 阅读 · 0 评论 -
机器学习 | 回归评估指标
文章目录1. 回归评估指标1.1 平均绝对误差 MAE1.1.1 Sklearn 计算 MAE1.2 均方误差 MSE1.2.1 Sklearn 计算 MSE1.3 $R^2$1.3.1 Sklearn 计算$R^2$2 参考资料关于分类评估指标,可以参考我的另一片文章:机器学习 | 分类评估指标1. 回归评估指标1.1 平均绝对误差 MAEMAE:(Mean Absolute Error...原创 2019-08-08 23:33:03 · 1152 阅读 · 0 评论 -
机器学习 | 分类评估指标
文章目录1. 分类评估指标1.1 混淆矩阵 Confusion Matrix1.1.1 scikit-learn 混淆矩阵函数接口1.2 真阳性TP、假阳性FP、真阴性TN、假阴性FN1.2.1 衍生评估指标1.3 准确率 Accuracy1.3.1 准确率不适用的情形:信用卡欺诈检测模型(不平衡数据)1.4 精确率 Precision1.4.1 精确率适用情形:垃圾邮件分类(高精度模型)1.5 ...原创 2019-08-08 23:29:27 · 2177 阅读 · 1 评论 -
机器学习 | 早期停止法原理及Python实现
文章目录1. 早期停止法1.2 Python 实现参考文献相关文章:机器学习 | 目录机器学习 | 梯度下降原理及Python实现1. 早期停止法对于梯度下降这一类迭代学习的算法,还有一个与众不同的正则化方法,就是在验证误差达到最小值时停止训练,该方法叫作早期停止法。下图展现了一个用批量梯度下降训练的复杂模型(高阶多项式回归模型)。经过一轮一轮的训练,算法不断地学习,训练集上的预测误差(...原创 2019-08-27 16:00:26 · 3205 阅读 · 2 评论 -
机器学习 | EM 算法原理
文章目录EM 算法1. EM 算法的引入三硬币模型2. EM 算法Q 函数参考文献相关文章:机器学习 | 目录本文大部分内容搬运自李航老师的《统计学习方法》[1],以给出 EM 算法较为完整的定义。EM 算法EM 算法是一种迭代算法,1977 年由 Dempster 等人总结提出,用于含有隐变量(hidden variable)的概率模型参数的极大似然估计,或极大后验估计。EM 算法的...原创 2019-10-07 01:06:18 · 685 阅读 · 1 评论