
Machine learning
机器学习
理想不闪火
研究开放环境下的深度学习算法、生成模型推理加速和医学图像。
欢迎订阅专栏!
展开
-
机器学习(MACHINE LEARNING)主成分分析(PCA降维)
文章目录1 概述2 spss实现3 输出4 EXCEL权重计算(不接上面内容)1 概述主成分分析是一种统计学方法,它主要通过降维来简化数据结构,将多个变量转化成少数的几个综合变量,而综合变量能很好地表达原来多个变量的大部分信息,变量之间需要要具备相关性,而经过分析后的变量之间没有相关性。主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。在许多领域的研究与应用中原创 2020-08-22 22:07:15 · 985 阅读 · 1 评论 -
机器学习(MACHINE LEARNING)种群竞争模型
文章目录1 概述2 程序1 概述当两个种群为争夺同一食物来源和生存空间相互竞争时,常见的结局是,竞争力弱的灭绝,竞争力强的达到环境容许的最大容量。使用种群竞争模型可以描述两个种群相互竞争的过程,分析产生各种结局的条件。有甲乙两个种群,它们独自生存时数量变化均服从Logistic规律两种群在一起生存时,乙对甲增长的阻滞作用与乙的数量成正比;甲对乙有同样作用。其中x(t),y(t)分别为甲乙两种群的数量,r1r2为它们的固有增长率, n1 n2为它们的最大容量。s1的含义是对于供养甲的资源来说,原创 2020-08-22 17:19:43 · 1370 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)多属性决策模型
文章目录1 多属性决策概念2 加权算术平均算子3 属性值归一化处理4 例子1 多属性决策概念首先,什么是多属性决策呢,它指的是利用已有的决策信息通过移动的方式对一组(有限个)备选方案进行排序或者择优。它的主要组成部分有如下2种:获取决策信息:属性权重和属性值(实数、区间数和语言)。通过一定的方式对决策信息进行集结并对方案进行排序和择优 现在我们暂时先抛开属性权重和属性值不讲,我们先来讲一讲第二点,也就是如何对决策的信息进行集结。信息集结的方法有很多,包括加权算术平均算子(WAA)加权几何平均原创 2020-08-22 16:43:08 · 2286 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)协方差与相关系数
文章目录1 样本均值2 样本方差3 协方差4 相关系数5 示例:数据集的相关系数计算1 样本均值2 样本方差3 协方差协方差(Covariance)在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。 如果两个变量的变化趋势相反,即其中一个大于自身的期原创 2020-08-19 09:16:45 · 943 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)MATLAB之surf()函数
文章目录1 代码2 result1 代码>> x=-3:3;>> y=-3:3y = -3 -2 -1 0 1 2 3>> [X,Y]=meshgrid(x,y)X = -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1原创 2020-08-16 21:10:09 · 1393 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)灰色关联分析(GRA)
文章目录1 什么是灰色关联分析2 灰色关联分析的步骤3 灰色关联分析的实例4 灰色关联分析matlab的实现5 灰色关联分析python的实现1 什么是灰色关联分析灰色关联分析是指对一个系统发展变化态势的定量描述和比较的方法,其基本思想是通过确定参考数据列和若干个比较数据列的几何形状相似程度来判断其联系是否紧密,它反映了曲线间的关联程度。通常可以运用此方法来分析各个因素对于结果的影响程度,也可以运用此方法解决随时间变化的综合评价类问题,其核心是按照一定规则确立随时间变化的母序列,把各个评估对象随时间的原创 2020-08-12 10:55:31 · 3413 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)MATLAB三层神经网络的简单应用
文章目录1 目的2 设计思路3 代码4 输出项目地址!!!!!!!!!!!!!!!!!!!!!!!!1 目的进行1-100以内的质数分类2 设计思路1、生成1-100以内的数和对应二进制2、对质数部分进行label为1,其余为03、选择前60组作为training数据,后40组testing4、选择三层神经网络,其中hidden和output部分使用sigmoid函数3 代码1、测试数据生成函数function f = dataset_generatorbits_num = 7;p原创 2020-05-31 11:32:58 · 1261 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)MATLAB经济金融领域简单数学模型和分析
文章目录1 概述2 MATLAB代码3 分析1 概述经济金融领域简单数学建模和分析:MATLAB成本曲线方程和销售收入直线方程2 MATLAB代码x=[0:0.1:5]; y=9*x; plot(x,y,'r','LineWidth',0.5)hold on;y=x.^3-6*x.^2+15*x;plot(x,y,'b','LineWidth',0.5)hold on;grid on;结果如图:3 分析根据数学图形进行经济现象分析。红色线y=9*x相当于销售收入曲原创 2020-05-29 21:26:34 · 1851 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)交叉验证(简单交叉验证、k折交叉验证、留一法)
文章目录1 简单的交叉验证2 k折交叉验证 k-fold cross validation3 留一法 leave-one-out cross validation针对经验风险最小化算法的过拟合的问题,给出交叉验证的方法,这个方法在做分类问题时很常用:1 简单的交叉验证1、 从全部的训练数据 S中随机选择 中随机选择 s的样例作为训练集 train,剩余的 作为测试集 作为测试集 test。2、 通过对测试集训练 ,得到假设函数或者模型 。3、 在测试集对每一个样本根据假设函数或者模型,得到训练集原创 2020-05-29 15:33:37 · 1772 阅读 · 1 评论 -
机器学习(MACHINE LEARNING)MATLAB动态规划解决背包问题
文章目录1 问题描述2 分析思路3 代码1 问题描述有编号分别为 a,b,c,d,e 的五种金银物品,它们的重量分别是2,2,6,5,4,它们的价值分别为6,3,5,4,6,现有一个承重为10的背包,如何让背包带走金银物品的价值总和最大?2 分析思路符号说明x(k): 表示在第k阶段的状态,状态就是第k阶段时的背包的重量u(k): 表示在第k阶段的决策,决策取1表示将第k个物品放入背包,取0则相反。v(x(k), u(k)): 表示在第k阶段的阶段指标,也就是决策的取到的第k个物品的价值f(原创 2020-05-28 21:23:26 · 1616 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)MATLAB和Python混合编程
文章目录1 配置方法2 使用方法2.1 脚本2.2 函数1 配置方法找到Matlab安装根目录,比如D:\matlab,然后进入D:\matlab\extern\engines\python目录中,Shift+右键–>“在此处打开命令窗口”,1.有管理员权限的,用 管理员权限执行:python setup.py install2 使用方法2.1 脚本在当前目录下,MATLAB建立test2.m脚本文件,内容如下b = 5;h = 3;a = 0.5*(b.* h)然后同目录下新原创 2020-05-28 21:11:57 · 1117 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)MATLAB模拟元胞自动机算法
文章目录1 元胞自动机理论2 元胞自动机3 演化规则4 森林火灾的演示1 元胞自动机理论元胞自动机与格子理论是一个非常好的模型,许多复杂的问题都可以通过它来建立模型,下面就简要介绍一下。2 元胞自动机元胞自动机实质上是定义在一个具有离散、有限状态的元胞组成的元胞空间上,并按照一定的局部规则,在离散的时间维度上演化的动力学系统。元胞元胞又可称为单元、细胞,是元胞自动机的最基本的组成部分。元胞具有以下特点:元胞自动机最基本的单元。元胞有记忆贮存状态的功能。所有元胞状态都按照元胞规则不断更新原创 2020-05-28 20:35:23 · 2137 阅读 · 1 评论 -
机器学习(MACHINE LEARNING)MATLAB求解状态转移矩阵
文章目录1 转移矩阵2 举例3 代码求解状态转移矩阵1 转移矩阵转移概率矩阵(又叫跃迁矩阵,英文名:transition matrix)是俄国数学家马尔科夫提出的,他在20世纪初发现:一个系统的某些因素在转移中,第n次结果只受第n-1的结果影响,即只与当前所处状态有关,而与过去状态无关。 在马尔科夫分析中,引入状态转移这个概念。所谓状态是指客观事物可能出现或存在的状态;状态转移是指客观事物由一种状态转移到另一种状态的概率。转移矩阵:矩阵各元素都是非负的,并且各行元素之和等于1,各元素用概率表示,在一定原创 2020-05-27 21:45:19 · 8509 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)MATLAB模拟排队论
文章目录1 概述2 模型介绍2.1 排队服务过程2.2 排队系统的要素2.3 顾客输入过程2.4 排队结构与排队规则2.5 服务机构与服务规则3 代码实现1 概述生活中需要排队的地方很多,本模型用于分析和仿真现实生活中的排队现象。排队论发源于上世纪初。当时美国贝尔电话公司发明了自动电话,以适应日益繁忙的工商业电话通讯需要。这个新发明带来了一个新问题,即通话线路与电话用户呼叫的数量关系应如何妥善解决,这个问题久久未能解决。1909年,丹麦的哥本哈根电话公司A.K.埃尔浪(Erlang)在热力学统计平原创 2020-05-27 21:31:57 · 2117 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)MATLAB模糊评价模型
文章目录1 举例讲解2 另一个例子3 输出结果截图1 举例讲解例1:对某品牌电视机进行综合模糊评价设评价指标集合:U= {图像,声音,价格} ;评语集合:V={很好,较好,-般,不好} ;这样一个模糊评价矩阵就建立完毕。2 另一个例子考虑一个服装评判的问题,为此建立因素集U={u1,u2,u3,u4},其中u1表示花色,u2表示式样,u3表示耐穿程度,u4表示价格,建立评判集V={v1,v2,v3,v4},其中v1表示很欢迎,v2表示较欢迎,v3表示不太欢迎,v4表示不欢迎,进行单原创 2020-05-27 20:33:16 · 1668 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)MATLAB灰色预测模型
文章目录1 概述2 灰色模型介绍3 精度检验等级参照表4 代码1 概述灰色预测模型(Gray Forecast Model)是一种基于小样本数据进行预测的模型。灰色预测模型所需建模信息少,运算方便,建模精度高,在各种预测领域都有着广泛的应用,是处理小样本预测问题的有效工具。(1)灰色系统、白色系统和黑色系统白色系统是指一个系统的内部特征是完全已知的,既系统信息是完全充分的。黑色系统是一个系统的内部信息对外界来说是一无所知的,只能通过它与外界的联系来加以观测研究。灰色系统介于白色和黑色之间,灰色系原创 2020-05-27 19:56:24 · 4350 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)MATLAB人口增长模型logistic参数确定
文章目录1 Logistic函数(又称sigmoid函数)2 logistic回归模型3 logistic 人口增长模型的参数确定1 Logistic函数(又称sigmoid函数)Logistic函数或Logistic曲线是一种常见的S形函数,它是皮埃尔·弗朗索瓦·韦吕勒在1844或1845年在研究它与人口增长的关系时命名的。广义Logistic曲线可以模仿一些情况人口增长(P)的S形曲线。起初阶段大致是指数增长;然后随着开始变得饱和,增加变慢;最后,达到成熟时增加停止。Logisitc模型是广义线性原创 2020-05-27 19:30:45 · 4456 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)MATLAB进行概率统计分析
文章目录1 产生随机变量2 概率密度与概率分布的计算2.1 概率密度2.2 累计概率3 常用统计特征计算1 产生随机变量二项分布随机数 binornd(N,P,m,n,...)正态分布随机数 normrnd(mu,sigma,m,n,...)均匀分布unifrnd/unidrnd泊松分布poissrnd指数分布exprnd卡方分布chi2rndT分布trndF分布frndγ分布gamrndβ分布betarnd2 概率密度与概率分布的计算2.1 概率密度专用函数:pdf:Pro原创 2020-05-27 17:30:38 · 720 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)使用ARIMA进行时间序列预测
文章目录1 引言2 简介3 python代码实现4 代码解析1 引言在本文章中,我们将提供可靠的时间序列预测。我们将首先介绍和讨论自相关,平稳性和季节性的概念,并继续应用最常用的时间序列预测方法之一,称为ARIMA。2 简介时间序列提供了预测未来价值的机会。 基于以前的价值观,可以使用时间序列来预测经济,天气和能力规划的趋势,其中仅举几例。 时间序列数据的具体属性意味着通常需要专门的统计方法。在时间序列中,ARIMA模型是在ARMA模型的基础上多了差分的操作。3 python代码实现(1)判断原创 2020-05-27 17:09:39 · 3501 阅读 · 3 评论 -
机器学习(MACHINE LEARNING)MATLAB蚁群算法解决TSP问题
文章目录1 蚁群算法2 蚁群算法与TSP问题的关系3 代码实现1 蚁群算法基本原理:(1)蚂蚁在携带等量的信息素一路释放(2)信息素浓度会和路径的长度成反比(3)下次蚂蚁来到该路口会选择信息素浓度较高的那条(4)短的路径上的信息素浓度会越来越大,最终成为蚁群的最优路径信息素更新模型蚁周模型(Ant-Cycle模型)蚁量模型(Ant-Quantity模型)蚁密模型(Ant-Density模型)区别:1.蚁周模型利用的是全局信息,即蚂蚁完成一个循环后更新所有路径上的信息素;2.蚁量和蚁原创 2020-05-26 21:55:43 · 2047 阅读 · 3 评论 -
机器学习(MACHINE LEARNING)MATLAB遗传算法
文章目录1 概述2 步骤2.1 种群初始化2.2 适应度计算(种群评估)2.3 筛选2.4 交叉(交配)运算2.5 突变2.6 终止判断3 代码1 概述遗传算法(Genetic Algorithm, GA)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解(所找到的解是全局最优解)的方法。参数编码、初始群体的设定、适应度函数的设计、遗传操作设计、控制参数设定五个要素组成了遗传算法的核心内容。2 步骤2.1 种群初始化(1)二进制编码二进制原创 2020-05-26 21:02:59 · 1768 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)MATLAB模拟退火算法【SA】
文章目录1 什么是智能优化算法2 常用的智能优化算法3 智能优化算法的特点4 模拟退火算法4.1 简介4.1 工具箱(SA)1 什么是智能优化算法智能优化算法又称现代启发式算法,是一种具有全局优化性能、通用性强且适用于并行处理的算法。这种算法一般具有严密的理论依据,而不是单纯凭专家经验,理论上可以在一定的时间内找到最优解或近似最优解。补充说明:启发式算法(Heuristic Algorithm)有两种定义:(1)基于直观或经验的构造的算法,对优化问题的实例能给出可接受的计算成本(计算时间、占用空间原创 2020-05-25 22:38:30 · 1172 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)MATLAB中微分方程的求解
文章目录1 MATLAB之极限、积分、微分2 matlab中微分方程的求解2.1 一阶微分方程2.2 求解二阶线性微分方程是指含有未知函数及其导数的关系式。解微分方程就是找出未知函数。微分方程是伴随着微积分学一起发展起来的。微积分学的奠基人Newton和Leibniz的著作中都处理过与微分方程有关的问题1 MATLAB之极限、积分、微分1、极限:用函数limit(f,x,x0,‘left’or’right’); 其中f 是定义的函数,x 是极限变量,x0是求极限的点,lift代表左极限,righ原创 2020-05-25 21:27:40 · 3097 阅读 · 1 评论 -
机器学习(MACHINE LEARNING)MATLAB非线性曲线拟合方法
文章目录1 得到散点数据2 确定函数模型3 确定选用函数模型中的未知参数在科学计算和工程应用中,经常会遇到需要拟合一系列的离散数据,最近找了很多相关的文章方法,在这里进行总结一下其中最完整、几乎能解决所有离散参数非线性拟合的方法1 得到散点数据根据你的实际问题得到一系列的散点例如:x=[3.2,3.6,3.8,4,4.2,4.8,5,5.4,6.2,6.4,6.6,6.9,7.1]';%加上一撇表示对矩阵的转置y=[0.38,0.66,1,0.77,0.5,0.66,0.83,1,0.71,0.原创 2020-05-25 20:26:54 · 4648 阅读 · 1 评论 -
机器学习(MACHINE LEARNING)MATLAB实现层次分析法案例【AHP】
文章目录1 建模步骤2 层次结构模型3 构建成对比较矩阵4 实际问题解决5 代码和结果分析5.1 代码 15.2 代码 25.3 分析1 建模步骤运用层次分析法建模,大体上可按下面四个步骤进行:建立递阶层次结构模型;构造出各层次中的所有判断矩阵;层次单排序及一致性检验;层次总排序及一致性检验。2 层次结构模型层次分析法是用来根据多种准则,或是说因素从候选方案中选出最优的一种数学方法3 构建成对比较矩阵准则层的五个因素比较矩阵4 实际问题解决Bi是三个地点关于准则层的比较矩阵原创 2020-05-25 17:18:04 · 3104 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)MATLAB求解利润最大化问题【线性规划】
文章目录1 线性规划2 利润最大化问题3 求解代码4 结果1 线性规划无论我们做什么事,都希望用最小的代价换取最大的利益,而线性规划就是解决这类问题的一个重要方法,下面我们通过1个具体的示例来介绍一下如何使用线性规划2 利润最大化问题某工厂生产三种产品,下面的表是这三种产品的利润和原料消耗,据此制定一个总利润最大的生产计划我们假设这三种产品的产量分别为x1,x2,x3,则其总利润的表达式为:产品的产量不能小于0,而且产量还受限于原料,于是就有了以下约束条件:我们的目标就是在满足这些约束条原创 2020-05-25 16:34:28 · 8365 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)MathWorks系列教程
文章目录1 .m文件和 .mat文件的区别1.1 性质不同1.2 调用不用2 format函数1 .m文件和 .mat文件的区别.m文件和 .mat文件的区别为:性质不同、调用不同、解析不同。1.1 性质不同一、性质不同1、.m文件:.m文件是保存一段代码zd的文件,类似于C语言中的一个函数体; 这也是MATLAB中最常见的文件内保存格式之一。2、.mat文件:.mat文件是matlab的数据存储的标准格式。也就是操作产生的数据的一个集合包,可以把一次处理的结果保存,供下一次使用。1.2原创 2020-05-24 17:59:23 · 1348 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)从零搭建一个汽车状态分类器(Tensorflow)
文章目录源码1 分析数据1.1 目标数据网站1.2 数据信息(转成onehot)1.3 数据预处理2 搭建模型2.1 导入数据2.2 搭建网络2.3 训练网络2.5 可视化学习过程源码完整代码已经上传到我的Github!1 分析数据1.1 目标数据网站HERE!数据位置:属性信息:1.2 数据信息(转成onehot)previous:After:首先我们需要了解一下...原创 2020-05-02 17:07:59 · 506 阅读 · 3 评论 -
机器学习(MACHINE LEARNING)Sklearn全高级使用(看不懂你来打我!)
文章目录1 正规化 Normalization1.1 数据标准化1.2 数据标准化对机器学习成效的影响2 检验神经网络 (Evaluation)2.1 误差曲线2.2 准确度曲线2.3 正规化2.4 交叉验证3 Cross-validation3.1 Model 基础验证法3.2 Model 交叉验证法(Cross Validation)3.3 以准确率(accuracy)判断(改变n_neigh...原创 2020-04-12 20:33:03 · 987 阅读 · 0 评论 -
机器学习(MACHINE LEARNING)Sklearn通用学习模式
文章目录1 选择学习方法2 通用学习模式2.1 要点2.2 代码实现2.3 重要代码讲解3 sklearn数据库3.1 要点3.2 代码实现3.3 代码解释4 sklearn常用属性和功能1 选择学习方法安装完 Sklearn 后,不要直接去用,先了解一下都有什么模型方法,然后选择适当的方法,来达到你的目标。Sklearn 官网提供了一个流程图, 蓝色圆圈内是判断条件,绿色方框内是可以选择的...原创 2020-04-12 15:34:22 · 910 阅读 · 0 评论 -
机器学习(MACHINE LEARNING) 【周志华版-”西瓜书“-笔记】 DAY16-强化学习
文章目录16.1 任务与奖赏RL与有监督学习、无监督学习的比较形象举例16.2 K-摇臂赌博机ε-贪心算法16.3 有模型学习16.4 免模型学习16.5 值函数近似16.6 模仿学习16.1 任务与奖赏当前的机器学习算法可以分为3种:有监督的学习(Supervised Learning)、无监督的学习(Unsupervised Learning)和强化学习(Reinforcement Lea...原创 2020-02-20 11:39:56 · 905 阅读 · 0 评论 -
机器学习(MACHINE LEARNING) 【周志华版-”西瓜书“-笔记】 DAY15-规则学习
15.1.规则学习“规则学习” (rule learning)是从训练数据中学习出一组能用于对未见示例进行判别的规则。 形式上一般为:式子中,右边的部分称为规则体(Body),表示该条规则的前提,由一系列逻辑文字(Literal)fkf_kfk 组成的合取式,合取符号⋀\bigwedge⋀表示“并且”。左边的部分称为 逻辑头(Head),表达该条规则的结果,也是逻辑文字,一般用来表示...原创 2020-02-19 09:15:52 · 552 阅读 · 0 评论 -
机器学习(MACHINE LEARNING) 【周志华版-”西瓜书“-笔记】 DAY14-概率图模型
14.1 隐马尔可夫模型隐马尔科夫模型(HMM)及Viterbi算法实现隐马尔科夫模型通过给定观察序列,预测隐藏序列,常用于需要从序列的表面信息挖掘隐藏信息的任务,例如语音识别、手写识别。原则上,隐马尔科夫模型还可进行诸如词性标注、中文分词等任务,但由于混淆矩阵的高宽同时由观察序列的种类数量决定,当运用到大型语料库时,词集的大小动辄上万,则混淆矩阵需要存储上亿的参数,对计算机而言不论是运行次数...原创 2020-02-18 10:34:22 · 541 阅读 · 0 评论 -
机器学习(MACHINE LEARNING) 【周志华版-”西瓜书“-笔记】 DAY13-半监督学习
13.1 未标记样本先说两个概念:1)有标记样本(Labeled)训练样本集Dl={(x1,y1), (x2,y2),…, (xl,yl)},这l个样本的类别标记已知。2)未标记样本(unlabeled)训练样本集Du={xl+1, x l+2,…, xl+u},u远大于l,这u个样本的类别标记未知。监督学习技术是基于有标记样本Dl的训练来构建模型,未标记样本Du所包含的信息未被利用;...原创 2020-02-17 13:05:02 · 757 阅读 · 0 评论 -
机器学习(MACHINE LEARNING) 【周志华版-”西瓜书“-笔记】 DAY12-计算学习理论
12.1 基础知识顾名思义,研究的是通过“计算”来进行“学习”的理论,即关于机器学习的理论基础,其目的是分析学习任务的苦难本质,为学习算法提供理论保证,并根据分析结果指导算法设计。12.2 PAC学习为什么要学习PAC学习理论? 此理论可以帮助我们更深入的了解机器学习的学习机制。 已经入门或者从事过一段时间机器学习相关工作的你有没有想过为什么在训练样本上学习了一个假设(函数?模型?...原创 2020-02-16 11:46:09 · 580 阅读 · 0 评论 -
机器学习(MACHINE LEARNING) 【周志华版-”西瓜书“-笔记】 DAY11-特征选择和稀疏学习
特征工程是机器学习中非常重要的一个环节,它的好坏直接影响了机器学习效果的优劣。而特征工程里非常关键的一步就是特征选择。如果把机器学习比作是一个厨师做菜的过程,那么数据就是原材料(菜),模型可以理解为炒菜的方式(蒸、煮、炒、炖等等),算法就是这个厨师的炒菜水平。特征工程就是前期处理食材的过程,有了食材(数据),首先要看看食材是啥,长什么样(源数据分布情况),然后看看食材是否新鲜,是否有磕碰破损(数...原创 2020-02-15 10:37:01 · 778 阅读 · 0 评论 -
机器学习(MACHINE LEARNING) 【周志华版-”西瓜书“-笔记】 DAY10-降维和度量学习
10.1 k近邻学习k近邻(k-Nearest Neighbor,简称kNN)学习是一种常用的监督学习方法。 二、近邻分类算法1、近邻分类算法的概念在近邻分类算法中,对于预测的数据,将其与训练样本进行比较,找到最为相似的K个训练样本,并以这K个训练样本中出现最多的标签作为最终的预测标签。在近邻分类算法中,最主要的是K-近邻算法。2、KNN算法概述K-NN算法是最简单的分类算法,...原创 2020-02-14 12:50:15 · 558 阅读 · 1 评论 -
机器学习(MACHINE LEARNING) 【周志华版-”西瓜书“-笔记】 DAY9-聚类
9.1 聚类任务聚类是一种!无监督!学习任务。聚类的结果应该满足:“簇内相似度”高且“簇间相似度”低。聚类的算法:原型聚类(基于原型的聚类):kk均值算法(k-means)、学习向量量化化算法(LVQ)、高斯混合聚类算法.原型聚类算法假设聚类结构能够通过一组原型刻画,是最为常用的方法.此类算法首先初始化原型,然后对原型进行迭代更新求解。密度聚类(基于密度的聚类):DBSCAN(Den...原创 2020-02-13 11:20:48 · 919 阅读 · 0 评论 -
机器学习(MACHINE LEARNING) 【周志华版-”西瓜书“-笔记】 DAY8-集成学习
8.1 个体与集成所谓集成学习(ensemble learning)简单理解就是指采用多个分类器对数据集进行预测,从而提高整体分类器的泛化能力。有时也被称为多分类系统,基于委员会的学习等。8.2 BoostingBoosting 是一种可将弱学习器提升为强学习器的算法。自适应地改变训练样本的分布,使得弱分类器聚焦到那些很难分类的样本上。它的做法是每一个训练样本赋予一个权重,在每一轮训...原创 2020-02-12 10:30:04 · 565 阅读 · 0 评论 -
机器学习(MACHINE LEARNING) 【周志华版-”西瓜书“-笔记】 DAY7-贝叶斯分类器
7.1 贝叶斯决策论贝叶斯决策(Bayesion decison theory)论是概率框架下实施决策的基本方法。对分类任务来说,在所有概率都已知的理想情形下,贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。下面我们以多分类任务为例来解释其基本原理。7.2 极大似然估计7.3 朴素贝叶斯分类器示例:过滤网站恶意留言一个很简单的例子,我本来想使用Data...原创 2020-02-11 11:04:34 · 742 阅读 · 0 评论