
机器学习
文章平均质量分 64
机器学习从入门到入门
MYVision_ MY视界
CV小硕
热衷CV领域的新技术
擅长C++/python
【小破站上 MYVision_ MY视界 就是我】
展开
-
12-机器学习之大数据学习
目录一 背景二 随机梯度下降法三 Mini-batch 梯度下降算法四 随机梯度下降算法收敛五 结束一 背景首先,如果在算法的训练样本量m不足的时候得到的模型具有高方差(High Variance),那么此时我们需要更多的训练样本。但是如果算法具有高偏差,提高样本数量并不会显著改善模型的性能。现在的海量数据集很容易就可以达到m=100,000,000这样的数量...原创 2019-09-04 14:53:09 · 279 阅读 · 0 评论 -
11-机器学习之推荐系统
目录一 预测电影评分二 基于内容的推荐三 如何学习参数四 协同过滤1.背景介绍2.协同过滤算法四 协同过滤的向量化实现五 如何找到跟某个电影相似的电影六 均值规范化一 预测电影评分现在一共有五部电影,并且有四个观众的评分数据,评分从一星到五星,观众有可能并没看该电影,也就是未评分。给出如下定义n_u=用户的数量 n_m=电影的数量...原创 2019-09-02 20:53:27 · 526 阅读 · 0 评论 -
10-机器学习之异常检测(anomaly detection)
目录一 背景二 算法过程三 样本的分配四 异常检测与监督学习五 如何选择特征六 异常检测中的误差分析流程七 多元高斯分布八 多元高斯分布建模九 如何选择原始模型和多元模型一 背景已知一个数据集,对于一个新的样本x-test,需要有一个模型来判断这个样本是好的样本还是异常样本定义一个模型(model) p(x)来判断样本是否是异常的,为该模型设定一个阈...原创 2019-09-02 20:53:20 · 930 阅读 · 0 评论 -
9-机器学习之PCA
目录一 降维二 主成分分析(PCA)三 PCA与线性回归的关系四 如何找到PCA的低维平面1. 对数据执行特征缩放或均值归一化2.计算样本的协方差Conv3.用SVD分解计算Conv的特征向量4.得到U矩阵的前K列并计算z五 选择PCA的k值六 PCA应用-压缩复原七 PCA的使用建议一 降维原因1:由于可能存在许多冗余的特征量,需要减少特...原创 2019-09-01 14:14:53 · 337 阅读 · 0 评论 -
8-机器学习之聚类
目录一 Kmeans 算法原理二 k-means 应用于非分离的数据集三 优化目标函数四 如何设置初始聚类中心五 初始化K值的方法背景:有监督的学习中,训练数据需要有标签,而无监督学习中,训练数据不需要任何标签。一 Kmeans 算法原理1.生成随机点(聚类中心)2.迭代执行如下两步until 聚类中心不再发生变化遍历每一个样本,计算每一个样本与不同聚...原创 2019-09-01 11:57:12 · 177 阅读 · 0 评论 -
7-机器学习之SVM
目录一 优化目标二 Cost function三 大间距分类器(SVM别称)四 SVM的数学原理五 用SVM训练复杂非线性分类器1.核函数2.高斯核函数示例3.根据标记点和已知的参数确定样本的分类六 如何选择标记点(landmarks)七 SVM参数选择技巧八 SVM 与逻辑回归的选择SVM是一种监督式学习算法,有时候它更简洁和强大一 优化目...原创 2019-08-29 18:37:42 · 676 阅读 · 0 评论 -
6-机器学习之模型评价
目录一 模型评价二 偏差-方差三 正则化与偏差-方差四 学习曲线五 模型调试的常识六 几个常用的性能度量指标1.错误率2.精度3.查准率(Precission)4.查全率(Recall)5.查准率与查全率的关系6.P-R图7.F1-Score8.ROC-AUC9.如何根据ROC评价学习器的优劣一 模型评价如果有多个待选的模型...原创 2019-08-28 10:01:25 · 377 阅读 · 0 评论 -
5-机器学习之神经网络
目录一 为什么要引入神经网络?二 神经网络中的术语与回归中的区别三 常见模型四 前向传播五 Cost Function六 反向传播1.反向传播与梯度下降2.单个神经元的计算过程七 训练神经网络的步骤一 为什么要引入神经网络? 对于参数过多或维度过高的计算,线性回归和逻辑回归计算起来不太现实。神经网络是比前两者更强大的非线性分类工具二 神经网络中的术...原创 2019-08-26 14:07:29 · 190 阅读 · 0 评论 -
4-机器学习之正则化
目录过拟合问题欠拟合过拟合过拟合问题发生是如何解决?如何正则化?如何理解惩罚项?如何避免惩罚的厉害导致欠拟合?需要控制参数的大小线性回归的正则化逻辑回归的正则化过拟合问题欠拟合模型对训练集的上的样本拟合的不好(高偏差模型),解释下什么是偏差,偏差(偏置bias)是指在训练之处,一个主观的判断,认为某个数据集应该符合某个模型(如线性),在这种...原创 2019-08-24 20:59:13 · 331 阅读 · 1 评论 -
3-机器学习之逻辑回归
目录一 逻辑回归与线性回归的区别为什么叫逻辑回归?二 0-1分类问题三 决策边界四 Cost Function五 梯度下降法六 多类别分类问题一 逻辑回归与线性回归的区别 线性回归解决的是拟合问题,逻辑回归解决的是分类问题 逻辑回归除了模型函数采用sigmoid函数之外,其他步骤与线性回归相同 什么是分类:预测的目标是离散值...原创 2019-08-24 19:54:10 · 203 阅读 · 0 评论 -
2-机器学习之线性回归
目录一 什么是线性回归?二 单变量线性回归三 代价函数四 梯度下降法五 多变量线性回归六 特征标准化七 用矩阵计算方法计算参数值(正规方程)一 什么是线性回归?就是将一堆样本的分布拟合到一条连续直线上。二 单变量线性回归先给出变量定义:m=用于训练的样本数 xi=第i个训练样本“输入”变量/特征量 yi=第i个训练样本“输出”变量...原创 2019-08-22 14:44:39 · 173 阅读 · 0 评论 -
1-机器学习初步概念
什么是机器学习一句话总结:就是给一堆数据,通过数学的方法估计出一个模型,用于对新数据进行分类或预测。机器学习的分类机器学习分为监督学习,半监督学习、无监督学习监督学习:给你一堆样本,告诉你准确答案,从样本中学到一个模型去预测新数据无监督学习:给你一堆样本,没有关于样本的先验知识,自己从样本中学到一个模型,例如聚类。半监督学习:样本中有部分给了先验知识,部分...原创 2019-08-22 14:16:38 · 194 阅读 · 0 评论