
机器学习
qq_29566629
热爱生活,热爱安全,热爱编程
展开
-
python模块numpy 中的tile函数
简介tile 函数是numpy自带的一个函数,最近在学习《机器学习实战》这本书时遇到了这个函数,刚开始很懵,后来才知道这个函数就是“重复,复制”的意思,具体用法如下用法tile(A,n)A代表需要重复的数组、列表等,n代表重复的数量令A=[1,2,3],当n是一个标量时,例如2,结果为:这里结果是在一个一维数组中。当n是一个一维向量时,例如(2,3),结果为:总结个人感觉,t...原创 2019-02-27 16:01:01 · 206 阅读 · 0 评论 -
对称矩阵与实对称矩阵
对称矩阵(Symmetric Matrices):是指以主对角线为对称轴,各元素对应相等的矩阵。 [1] 在线性代数中,对称矩阵是一个方形矩阵,其转置矩阵和自身相等。实对称矩阵:如果有n阶矩阵A,其矩阵的元素都为实数,且矩阵A的转置等于其本身(aij=aji)(i,j为元素的脚标),则称A为实对称矩阵。两个概念的不同之处在于:实对称矩阵里的元素全是实数,而对称矩阵只说明A^T=A,没说明矩阵...原创 2019-09-24 11:05:11 · 16675 阅读 · 2 评论 -
方差、协方差、相关系数等相关概念总结
前言在看PCA时,涉及到一个重要概念“协方差”,这里正好总结一下概率论中的几个基础概念:1.平方差其实平方差严格来说不算概率论中的概念,是数学公式的一种,它属于乘法公式、因式分解及恒等式,被普遍使用。平方差指一个平方数或正方形,减去另一个平方数或正方形得来的乘法公式:a²-b²=(a+b)(a-b)。.2.随机变量随机变量是可以随机的取不同值的变量,只是对可能状态的描述,不能说一个随机变...原创 2019-09-24 09:02:32 · 1167 阅读 · 0 评论 -
范数定义以及在机器学习中的作用
https://baijiahao.baidu.com/s?id=1607333156323286278&wfr=spider&for=pc转载 2019-09-16 16:51:25 · 316 阅读 · 0 评论 -
2019谷歌开发者大会纪录,干货满满~
前言刚开始报名的时候其实没有抱太大希望,在接到短信的时候可真是欣喜若狂,哈哈,然后才有了这两天极其难忘的经历。这届大会从2019.9.10到1日共两天。地址在上海世博中心。第一天排队进场,人很多,真的超出了我的预期。进来 以后就领到了胸卡,简约、硬核。场馆很霸气接着就进入正题了第一个演讲: 大会开幕主旨演讲开场演讲由谷歌大中华区总裁陈俊廷进行,看了履历,真的是...原创 2019-09-14 19:26:30 · 635 阅读 · 0 评论 -
机器学习系列之(七)决策树
前言决策树分类的思想很简单,复杂的是对里面的各种概念的理解和各种学科的交叉,包括信息论、概率论等,还有比如熵、条件熵、信息增益、基尼指数等,下面就先从概念开始进行介绍。定义参考下图:还是先拿去不去相亲为例,现在有一个女孩,其具有三种特征(白不白,富不富,美不美),刚开始判断她白不白,然后是富不富,最后是美不美,最后得到去、犹豫、不去三种可能中的一个。这个过程很符合人类的思考方式,但是这...原创 2019-08-16 11:07:45 · 164 阅读 · 1 评论 -
机器学习系列之(六)朴素贝叶斯分类
前言网友写的关于朴素贝叶斯的例子真的是脑洞大开,关于根据女孩的身材、高矮、胖瘦等特征来判断她是否漂亮的、根据男孩帅不帅,高不高,上不上进等来判断应不应该嫁的,千奇百怪,学的时候真的是乐趣无穷,个人觉得,学习就得这样。好了,言归正传,从贝叶斯公式讲起。贝叶斯公式这是最基础的贝叶斯公式,转化为机器学习中的形式就是:大致解释一下:设一个女孩x1,其具有的特征有(瘦,脸蛋好看,高),类别是...原创 2019-06-18 21:33:10 · 255 阅读 · 0 评论 -
机器学习系列之(二) 逻辑回归
前言如果想了解线性回归的知识,可以看一下博主的前一篇博客线性回归,逻辑回归这一篇是承接着上一篇的。逻辑回归虽然名字叫做“回归”,但是却实打实是个分类算法,而且是最基础也很重要的一类分类算法,这一点一定要注意。问题引入在现实生活中,分类问题无处不在,比如垃圾邮件(是/否),肿瘤是否是恶性的等,这里就可以用0:负类,1:正类来表示分类结果,那么在我们收集了诸多数据,如邮件里广告词的数量、邮件代...原创 2019-05-29 15:45:39 · 217 阅读 · 0 评论 -
机器学习系列之(一) 线性回归
前言学习机器学习也有一年多了,最近因为需要面试得把基础巩固一下,所以又重新复习了一下基础知识,这个系列将作为总结的第一篇,和大家一起学习(有个建议,平时没事的时候多看看以前看过的资料,随着你知识积累的增加,真的,每次都会有新发现)问题引入本篇将以吴恩达老师的机器学习课为基础进行讲解,网址为吴恩达线性回归网址。这里以最经典的房价预测为例,如图:在波特兰,你收集到了几十组数据,形如(siz...原创 2019-05-29 10:53:08 · 162 阅读 · 0 评论 -
信息量与信息熵
信息量香农他老人家作为一个旷世天才,研究出了信息论这一对后世产生了巨大影响的理论,而这一理论的基础概念就是信息量。“信息是用来消除随机不确定性的东西”。也就是说衡量信息量大小就看这个信息消除不确定性的程度。“太阳从东方升起了”这条信息没有减少不确定性。因为太阳肯定从东面升起。这是句废话,信息量为0。“吐鲁番下中雨了”(吐鲁番年平均降水量日仅6天)这条信息比较有价值,为什么呢,因为按统计来看...原创 2019-05-29 08:55:37 · 254 阅读 · 0 评论 -
机器学习系列之(五) 正则化
前言之所以要使用正则化,就是为了减少过拟合,通过减小假设函数中的参数来达到这个目的。常见正则化方式lasso回归与岭回归使用L1正则化的线性回归叫做lasso回归,L2正则化的线性回归叫做岭回归对于lasso回归来说,不仅可以预防过拟合,还可以通过使某些参数变成0的方式来进行特征筛选,预防“维度灾难”的发生,达到降维的目的。岭回归可以显著的预防过拟合。...原创 2019-05-30 20:05:40 · 136 阅读 · 0 评论 -
机器学习系列之(三) softmax回归
前言很多人都把softmax回归当做logistic回归的扩展形式,但是在我看来,这两个回归方式的差异还是很大的,差异如下:逻辑回归针对的数据是符合二项分布的数据,而softmax回归针对的是符合多项分布的数据。逻辑回归对线性组合后的数据进行非线性转化的时候采用的是logistic函数,将原始数据映射为(0-1)之间的数字,而softmax回归采用的是softmax函数,他通过与类别数相等...原创 2019-05-30 16:55:06 · 376 阅读 · 0 评论 -
机器学习系列之(四)-- KNN
前言本文参考内容来源:https://blog.youkuaiyun.com/x603560617/article/details/83621324https://blog.youkuaiyun.com/qq_36330643/article/details/77532161最近在学习斯坦福的视觉课程,第一个主要内容就是通过KNN算法来对图像进行分类,效果当然很不好,但是作为大家接触到的第一个机器学习算法,还是有必...转载 2019-05-30 14:31:48 · 187 阅读 · 0 评论 -
概率论6大基本分布
看到机器学习中,要求训练集和测试集来自同一分布,然后学习了一下概率论中分布的类型,说明如下:概率论中的六种常用分布,即(0-1)分布、二项分布、泊松分布、均匀分布、指数分布和正态分布。引用说明:https://blog.youkuaiyun.com/cc1949/article/details/78906044...转载 2019-05-30 13:51:51 · 8844 阅读 · 2 评论 -
tensorflow中get_variable函数的使用
get_variable()tf.get_variable(name, shape, initializer): name就是变量的名称,shape是变量的维度,initializer是变量初始化的方式,初始化的方式有以下几种:tf.constant_initializer:常量初始化函数tf.random_normal_initializer:正态分布tf.truncated_norm...原创 2019-05-10 10:50:34 · 1576 阅读 · 0 评论 -
算法岗面试凉经
算法岗面试凉经算法岗第一个面试,纯粹是为了积累经验,也没想着能进去,果然不出所料,凉的透透的。。。。第一点:简历上你写的每个点你都要精通 !简历上你写的每个点你都要精通!简历上你写的每个点你都要精通!(重要的事说三遍)面试官是个很和善的人,除了技术以外,聊得都很开心(尴尬。。),先说上面这点,既然写到简历上了,就说明自己对这方面能力很有自信,那么你就得对简历上的每个字都特别熟悉,比如我在简历...原创 2019-03-15 17:45:43 · 544 阅读 · 0 评论 -
决策树中的熵与信息增益
引言最近在学习决策树,花了一上午学习了熵与信息增益,这里打算使用一个实例来帮助自己加深理解,和大家一起学习。熵熵这一概念是由信息论的鼻祖克劳德·香农创造出来的,刚开始谁也不知道这个词的具体意思(这可能就是香农的初衷),这个词是从热力学中借鉴得来的,大致意思是度量物质的离散以及无组织状态的程度,在信息论中产生了信息熵,大致也可以理解为信息中各类信息的混乱程度,其数学公式为:其中,pi代表某...原创 2019-02-27 13:17:53 · 696 阅读 · 0 评论 -
python numpy模块 argsort()函数的用法
简介对数组进行排序是一项很常见的工作,numpy的argsort函数提供将向量排序以后再根据元素在原来数组中的位置进行显示的功能。举例一个数组a排序后:...原创 2019-02-27 17:25:04 · 297 阅读 · 0 评论 -
笛卡尔坐标系和极坐标系
前言在机器学习中,数据的表示至关重要,而数据在不同坐标系中的表示也对于模式的识别有着巨大的影响,这里总结三种坐标系(都是中学的内容)1.笛卡尔直角坐标系相交于原点的两条数轴,构成了平面放射坐标系。如两条数轴上的度量单位相等,则称此放射坐标系为笛卡尔坐标系。两条数轴互相垂直的笛卡尔坐标系,称为笛卡尔直角坐标系。如图:2.笛卡尔斜坐标系互相垂直且有公共原点的两条数轴构成平面直角坐标系,而...原创 2019-09-25 08:49:55 · 8688 阅读 · 0 评论