多元线性回归
机器学习基础之多元线性回归 描述了假设函数、求解方法(梯度法和正规方程)、基于Octave/MATLAB的向量化表达方法。
逻辑回归
主要任务: 逻辑回归(logistic regression)分类 正则化(regularization),避免过拟合(over fitting)
- 逻辑回归的表达式与求解方法
- 应用逻辑回归到多类分类上
- 应用正则化的方法避免过拟合
神经网络的表达式
神经网络可应对复杂的非线性分类。 非线性假设当特征量多大时,特征的非线性组合方法种类的数量会非常庞大,可能对造成过拟合与极大的计算复杂度的问题。
神经网络的学习
神经网络包含前向传播与反向传播。
- 神经网络的代价函数
- 神经网络的反向传播表达与算法
- 神经网络的应用
机器学习系统设计与应用机器学习的建议
关于应用机器学习的建议与设计机器学习系统。 提高机器学习系统的性能,学习评估方法是一种有效的解决方案,其中包含统计、分析错误分类数据,学习曲线讨论偏差与方差,讨论正则化参数和偏差与方差的关系等。 构建一个优秀的机器学习系统,必须能够处理有偏斜的数据,以增加系统的有效性与鲁棒性,而数值评估的误差分析,查准率与召回率的评估是有效的办法。 大数据是目前热议的话题,的确大数据在某些机器学习系统中有显著的作用。
支持向量机 SVM
支持向量机 Support vector machines SVM 介绍了支持向量机的代价函数、核函数与求解算法。同时,不同的监督学习算法的使用场合,也做了初步的介绍。 同时着重介绍了高斯核函数的计算方法。 在本文,我提供了 SVM 导论的下载链接与 svm 软件包的下载链接。 希望大家的一起交流,一起成长。
无监督学习与维度约减
这里介绍了无监督学习与纬度约减的基础知识。 无监督学习部分:
- 数据类型:无标签
- K-means 以及代价函数与算法
- K-means 中参数 K 的选择
维度约减(降维)部分:
- 主成分分析的概念、数学表达与求解方法
- SVD 的降维应用
异常检测与推荐系统
异常检测 异常检测被广泛应用于欺诈检测(例如信用卡被偷事件)。给定大量数据,指出与均值有巨大差异的点。例如,在制造业中检测缺陷与异常。高斯分布对数据建模往往会很有用。 本模块涉及“推荐系统”(Amazon, Netflix, Apple 等公司用它来向用户推荐产品)。推荐系统(Recommender systems)寻找用户与产品间的交互模式从而生成推荐建议。
大规模机器学习
大规模机器学习 大规模机器学习面上海量数据的要求,其方法是类似映射化简(SOM)的思路。 目前已有的平台有 Hodoop。 本文介绍了一些大规模机器学习中会遇到的随机梯度下降法、映射化简的概念,同时在线学习也是一种在海量数据中应运而生的学习模式。
应用实例:照片识别
应用实例 本文主要讲了有关图像识别项目相关的介绍,仅仅设计简单的机器学习系统设计,包含系统流水线、上限分析、人工数据合成。 当然,文字识别与人脸识别的简单系统由详细的介绍,可以用以初步的了解。 Python, Java, MATLAB 都有机器学习的工具箱。