- 博客(20)
- 资源 (18)
- 收藏
- 关注
原创 图解AUC和GAUC
网上看过不少关于AUC和GAUC的材料,但是都是文字描述,一点也不直观, 因此阿航萌生了使用图解的方式详细剖析一下AUC和GAUC的想法,也希望以此能帮助大家快速理解概念。其中,说到AUC就不得不提ROC曲线,因此这里阿航分三个部分来解读:ROC、AUC、GAUC。〇、ROC前身:通用的对分类模型的评价步骤1:给定样本如图A:其中绿色为正样本,红色为负样本步骤2:训练一个机器学习模型,...
2019-06-18 17:51:12
7711
11
原创 【自己动手写机器学习算法】第5章 决策树
第5章 决策树顾名思义,"决策树"就是按照建立分支来进行决策的方法,即根据啥(往往是根据某个属性的某个值作为指标,比如“年龄大于20岁的”或“身高大于1米5的”)来区分不同类别的数据,也是一种监督式机器学习算法,从编程角度来看,可以看作是一系列的"if… then… else…"的集合,这个模型非常直观,也即可读性非常好,决策树的学习通常包含三个步骤:特征选择,决策树生成,决策树的剪枝.给定数...
2019-02-20 18:50:32
421
原创 【自己动手写机器学习算法】第4章 朴素贝叶斯
第4章 朴素贝叶斯朴素贝叶斯的基本思想是: 基于特征条件独立假设学习输入和输出的联合概率分布,然后,基于此模型,对给定的输入xxx,利用贝叶斯订立求出后验概率最大的输出yyy,根据《统计学习方法》书中的规划,这里将简述朴素贝叶斯的学习和分类、朴素贝叶斯的参数估计方法。4.1 朴素贝叶斯的学习和分类4.1.1简述输入:训练数据集 T={(x1,y1),(x2,y2),(xi...
2018-09-03 14:40:12
448
原创 【自己动手写机器学习算法】第3章 k近邻法描述
K近邻算法本身是个很简单的算法,某些时候甚至不能称之为机器学习算法,因为它没有“学习”的过程,仅仅通过判定和要预测的xxx相近的点都呈现的表征来确定xxx的对应类标yyy就可以了,但是《统计学习方法》这本书使用了KD-tree的方法来寻找最近邻,其主要目的是在数据量比较大的时候能够优化查找效率,从原理来讲,树结构的查找的时间复杂度O(logN)O(logN)O\left( logN \right)...
2018-09-03 14:32:53
227
原创 【自己动手写机器学习算法】第2章 感知机
第2章 感知机感知机模型实际是最简单的模型之一,台大林轩田老师发布的《机器学习基石》教程中,称之为“知错能改验算法”,就是发现错误进行纠正,具体这个算法的过程如下。2.1感知机模型 定义: 输入空间到输出空间的函数为f(x)=sign(w⋅x+b)f(x)=sign(w⋅x+b)f(x) = sign(w\cdot x + b) 其中 sign(x)={+1,−1,...
2018-06-03 11:09:46
240
原创 【自己动手写机器学习算法】第1章 统计学习方法概论
第1章 统计学习方法概论统计学习简述之,从数据中挖掘规律,并形式化表现这种规律并将之应用在将来的数据之中,其实现在的机器学习方法都是离不开统计学原理的,这也就是本人结合李航的《统计学习方法》来编写统计学习的相关基础算法的初衷。一些基本的概念这里不再赘述,统计学习方法包含了监督式学习、非监督式学习、半监督式学习和强化学习等。这里也先假定每个读者对这些概念已经有了一些初步的了解,如果不了解,也...
2018-06-03 11:04:40
279
原创 Python 自动将数据按比例随机为训练集和测试集代码
PART 1. 想在网上找到关于将数据集自动抽样的方法,看见了其实Pandas库下有一个方法可以抽样,但是感觉不是很灵活,而且数据类型是dataframe的,不是很习惯,这里就写了一个方法,输入是数据集X(m*n),数据集类别标签Y(m*1),训练集比例pct(0~1),返回训练数据集和测试数据集,返回的数据中最后一列是类别标签。import randomimport numpy as n...
2018-04-06 17:38:29
10607
4
原创 UFLDL Tutorial 课程核心内容提炼-3:自编码算法和稀疏性
该课程在斯坦福深度学习课上,点此打开 核心内容,自编码器,非监督学习方法。如果隐藏层的神经元数目较少,很好理解,如果较多,则要对隐层进行稀疏性限制,引入惩罚因子,这个惩罚因子和信息熵理论中的散度有关,所以引入KL-divergence进行转换,转换完成之后,为了求解这个最后的解,即的h,给出最终的损失函数,之后就和普通的神经网络一致了,进行梯度求解,迭代解出h。-----------...
2018-02-26 17:59:08
342
原创 UFLDL Tutorial 课程核心内容提炼-2:反向传导算法
该课程在斯坦福深度学习课上,点此打开--------------------------------------------------分割线------------------------------------------------------一、概述 固定样本集 ,它包含 个样例,可以用批量梯度下降法来求解神经网络(W和b),对于单个样例,其代价函数为: ...
2018-02-26 10:58:07
303
原创 UFLDL Tutorial 课程核心内容提炼-1:神经网络
该课程在斯坦福深度学习课上,点此打开--------------------------------------------------分割线------------------------------------------------------一、概述 训练样本集: 神经网络算法能够提供一种复杂且非线性的假设模型 ...
2018-02-26 10:32:45
467
原创 深度学习实战 1-补充:搭建Ubuntu16.04+Anaconda(内嵌Python3.5) + theano
由于工作需要,需要使用Theano的深度学习框架进行学习,这时,如果单纯地直接使用类似Tensorflow的安装方法来配置Theano,往往会产生包的依赖性问题,这里给出配置方法,需要说明的是,配置的时候要使用CUDA toolkit环境,这里要求使用nvidia的计算显卡支持。
2017-12-28 19:20:04
421
原创 深度学习实战 1-搭建Ubuntu16.04+Anaconda(内嵌Python3.6)+tensorflow
前两天一直在配置CUDA环境,结果到最后发现自己的电脑还是显卡配置太低没法进行GPU加速运算,所以回头来还是只使用CPU环境来学习tensorflow吧。目前,关于环境搭建问题,好像也没之前那么复杂了,这里给出我自己的环境配置过程,很简单:
2017-12-20 11:47:31
481
原创 耦合相似度计算度量算法(COS算法,即Coupled Object Similarity算法)的实现
Coupled Object Similarity,即COS耦合相似度算法计算,用以解决名词性问题的相似度计算算法
2017-03-11 16:18:18
5636
5
原创 机器学习算法实践-算法原理-EM算法(二)-推导和证明
发现之前写的那一篇EM算法的分析还是不够条理和清晰,在我后来分析的过程中,重新写了一篇文档,应该还算是比较清晰和条理好多,至于上一篇,可以当作是EM的预备知识吧,略看略读一下就好,有些概念清楚了之后看这一篇推导应该还是可以轻松一些的,这一篇里尽可能也是没有多说废话把原理讲清楚,特此把EM再在这里分享一下。...
2017-03-10 19:55:34
487
原创 机器学习算法实践-算法原理-EM算法(一)-初识EM以及相关概念
转载请标明出处http://blog.youkuaiyun.com/zhaohang_1/article/details/52809504,谢谢合作!网上也是看了好几个大牛写过的文章,后来发现每个人的出发点不一样,大多是从数学角度上先来阐述原理的,然后完全复写了“E”和“M”过程,对于我这种刚上研究生数学底子有点差的人来说实在有点太过晦涩,我也是在读了各家关于EM的表述后想尽量做到对小白讲明白“EM”算法。不...
2016-10-13 19:44:19
859
原创 机器学习算法实践-聚类算法-无监督聚类-DBSCAN
实际上这个代码主要是参考了下面URL的代码,为了便于matlab输出信息,修改在了一个文件里面,但是他的主题思路很清晰,还是很建议读者读一下的。
2016-09-04 11:24:27
668
原创 语义网技术(3):RDF,OWL相关文档材料汇总以及下载链接
由于RDF和OWL相关材料或者文档相当杂碎,特此我把我目前已有的材料都放在这里算是汇总,后面我会不定期持续补充:1.An Introduction to RDF and the Jena RDF API2.OWL Jena 相关开发文档材料3.语义Web本体语言_-OWL1&OWL2.pdf4.Jena_中文教程_本体API(经典)5.OWLWeb本体语言 指南...
2016-08-20 10:00:33
1041
原创 机器学习基石学习笔记(1)-PLA
PLA是Percepton Learning Algorithm(感知器学习算法)的缩写,通俗理解为“知错能改演算法”。
2016-04-18 10:13:34
1531
1
原创 语义网技术(2):jena的使用——更多示例和代码分析(上,例子从例2-例5)
已经毕业了,论文也交了,总算轻松一点了,现在也准备把RDF相关知识和Jena的编程技术统一做个总结,写个系列的博客,一来是相当于给自己做个笔记,二来也是分享一些自己学到的东西,提供一些资源,以供大家共同学习。这次准备把Jena示例中其他几个程序的代码解释一下,而后将简述RDF的相关知识概念,再之后将进阶OWL阶段。好了,废话不多说了,上代码,上一篇博文为例1,这一篇博文从例2开始,另外为了简化篇幅...
2015-06-15 14:02:25
2371
2
原创 语义网技术(1):jena的使用——环境以及实例
大四毕设做关于语义网技术的研究,其中需要学习关于protege,jena等工具,以及owl和rdf的技术,网上的资料比较少,在这里给自己做一个学习的记录。关于jena和protege简单说,写个式子:(jena→java) = (protege→用户)不难理解,jena对编程来说就像protege对用户的关系一样,这个是网上的资料的普遍说法,另外这个只做了解,这个系列的blog不出意外...
2015-04-13 19:44:04
3211
htmlunit-2.15-bin.zip
2015-04-12
jsoup-1.7.2.jar
2015-04-12
C#编写的云南大学校园导航系统
2012-12-04
C++(WINAPI )编写的迷宫
2012-12-04
数据结构魔王语言
2012-10-30
一元稀疏多项式计算以及线性方程组求解器
2012-10-22
C++编写的复数计算器
2012-09-26
复数计算器项目测试
2012-09-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人