
统计学习
yunlinzi
这个作者很懒,什么都没留下…
展开
-
统计学习 -- 基本概念篇
定义基于数据构建概率统计模型并运用模型对数据进行分析与预测。三要素:模型、策略、算法统计学需一般经过以下步骤:(1)得到一个有限的训练数据集合;(2)确定包含所有可能的模型的假设空间,即学习模型的集合;(3)确定模型选择的准则,即学习的策略;(4)实现求解最有模型的算法,即学习的算法;(5)通过学习方法选择最优模型;(6)利用学习的最优模型对新数据进行预测或分析。综上,即用算法...原创 2019-05-09 21:05:18 · 291 阅读 · 0 评论 -
LIBSVM在MATLAB中的使用
LIBSVM简介准备工作下载LIBSVM工具(LIBSVM工具下载地址),然后解压,在MATLAB中进行make生成相应的可执行文件即可使用,后续的模型训练等工作主要是使用以下四个文件(函数):libsvmread.mexw64: 将原始数据(txt,xls等)转化为SVM package格式libsvmwrite.mexw64: 将SVM package格式合并成其它格式文件(txt,...原创 2019-05-21 15:32:52 · 905 阅读 · 0 评论 -
统计学习 -- 感知机篇
定义感知机是二分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1值,感知机学习旨在求出将训练数据进行线性划分的分离超平面.是神经网络和支持向量机的基础.感知机模型感知机学习策略感知机学习算法...原创 2019-05-16 21:16:12 · 214 阅读 · 0 评论 -
统计学习 -- k-NN篇
k 近邻法是一种基本的分类与回归方法,其三个基本要素是k值的选择、距离度量、分类决策规则,一个实现方法是kd树。它的基本思想是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的k个实例,这k个实例的多数属于某个类,就把该输入实例分为这个类。当k=1时为特殊情况,称为最近邻算法。当三要素确定之后,对于任何一个新的输入实例,它所属的类唯一地确定。距离度量: 欧氏距离,DT...原创 2019-06-05 10:57:04 · 267 阅读 · 0 评论 -
统计学习 -- SVM篇
SVM简介1、是一种二分类模型;2、基本模型是:定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别于感知机;3、核技巧使得SVM成为实质上的非线性分类器;4、学习策略:间隔最大化;5、学习算法:求解凸二次规划的最优化算法;6、三个模型(由简至繁所分的三类SVM模型):(1)线性可分SVM,又称硬间隔 SVM,当训练数据线性可分时,通过硬间隔最大化学到的线性分类器;(2)线性S...原创 2019-06-13 15:54:58 · 519 阅读 · 0 评论