- 博客(42)
- 收藏
- 关注
原创 ML-熵、条件熵、信息增益
通俗理解条件熵特征选择之信息增益法(必看!系统介绍了熵、条件熵、信息增益的概念及推导)条件熵的计算(必看!知乎前三个回答都看一下,有关于熵、条件熵、信息增益的实践)我通过例子一步一步讲解这个概念。在决策树算法的学习过程中,信息增益是特征选择的一个重要指标,它定义为一个特征能够为分类系统带来多少信息,带来的信息越多,说明该特征越重要,相应的信息增益也就越大。概念熵:...
2019-03-29 22:21:44
467
原创 ML-朴素贝叶斯
参考《西瓜书》P151以前对贝叶斯参数的计算过程不是很清楚,在西瓜书里讲的很详细,原来可以把X属性分为离散型与连续型,离散型的话可以直接按照频率计算,连续型的话,要用极大似然估计,首先假设概率密度函数满足一个分布,比如正态分布,然后利用已知的数据集(X,Y),来预测参数。预测过程可以参考逻辑回归推到损失函数。后验概率由于对所有类别来说P(X)相同,因此贝叶斯判定准则有...
2019-03-20 19:44:38
282
原创 Java-常见数据结构
HashMapJava map 详解 - 用法、遍历、排序、常用API等HashMap设计原理、HashMap的数据结构、HashMap源码实现1、在HashMap原理介绍中,有put的源码,可以看到,put()方法中,如果key在链表中已存在,则替换为新value,也就是说一个key只能对应一个value,而且put()会返回上个value值...
2019-03-19 16:00:27
225
原创 TF-1
https://www.zhihu.com/question/54513728name_scope, variable_scope等如何理解交叉熵tensorflow-损失函数详解交叉熵刻画的是两个概率分布之间的距离,是分类问题中使用比较广泛的损失函数之一。给定两个概率分布p和q,通过交叉熵计算的两个概率分布之间的距离为:我们通过softmax回归将神经网络前向传播得到的结...
2019-03-12 16:50:45
285
原创 阅读-MTCNN
原始数据人脸数据集WIDER FACE,该数据集仅提供了大量的人脸边框定位数据。如果使用wider face的 wider_face_train.mat 注解文件需要转换成txt格式的,我这里用h5py写了个 转换脚本. 这里我提供一个已经转换好的wider face注解文件anno_store/wider_origin_anno.txt, 以下训练过程参数名--anno_file默认...
2019-03-09 16:44:53
2376
2
原创 ML-机器学习实践
目录超参数选择Gride SearchRandom Search相关库几种参数估计的区别与联系:MLE、MAP、贝叶斯TODO余弦相似度(cos距离)与欧式距离的区别和联系1)区别2)联系归一化 标准化混淆矩阵、模型度量指标:准确率、精确率、召回率、F1值关联规则挖掘的3个度量指标:支持度、置信度、提升度超参数选择Gride Searc...
2019-03-05 15:58:17
425
原创 网课-cnn
图像识别中遇到的问题可能有图片特征的纬度过高,1000*1000像素的图片,特征维度是1000*1000*3,如果你要输入3百万的数据量就意味着特征向量的维度高达三百万,也许有1000个隐藏单元,而所有的权值组成的矩阵W[1],如果使用标准的全连接网络,这个矩阵的大小将是1000*3百万,也就是30亿个参数。带来的问题:巨大的内存需求+很容易会过拟合,除非你可以提供非常多的样本数据。为了能处理大图...
2019-03-05 10:32:38
537
原创 ML-逻辑回归-Softmax-交叉熵(小航)
在分类问题中,交叉熵的本质就是【对数】似然函数的最大化逻辑回归的损失函数的本质就是【对数】似然函数的最大化最大似然估计讲解:https://www.jianshu.com/p/191c029ad369参考统计学习方法笔记 P79softmax通过Softmax回归,将logistic的预测二分类的概率的问题推广到了n分类的概率的问题。通过公式softmax...
2019-02-27 20:30:14
545
原创 ML-机器学习基础
目录偏差与方差导致偏差和方差的原因深度学习中的偏差与方差生成模型与判别模型两者之间的联系优缺点常见模型先验概率与后验概率偏差与方差偏差与方差分别是用于衡量一个模型泛化误差的两个方面: 模型的偏差,指的是模型预测的期望值与真实值之间的差; 模型的方差,指的是模型预测的期望值与预测值之间的差平方 在监督学习中,模型的泛化误差可分解为偏差、方差与...
2019-02-27 20:02:19
284
原创 课程-计算机语言学
验证集与早停止把标注数据分成三部分训练集 training set 测试集 test set 验证集 validation set训练时,监控验证集错误率 在验证集错误率上升时,提前终止训练,在模型过拟合之前终止训练过程 用测试集上的错误率来衡量模型的推广能力 训练集-测试机-验证集 60:20:20思考模型容量:模型拟合数据的能力...
2019-02-27 09:32:10
640
原创 DL-深度学习基础
目录过拟合与欠拟合降低过拟合风险的方法降低欠拟合风险的方法过拟合与欠拟合欠拟合指模型不能在训练集上获得足够低的训练误差 过拟合指模型的训练误差与测试误差(泛化误差)之间差距过大 反应在评价指标上,就是模型在训练集上表现良好,但是在测试集和新数据集上表现一般呢(泛化能力差) 降低过拟合风险的方法所有为了减少测试误差的策略统称为正则化方法,这些方法可能以增大训练误差为...
2019-02-22 16:43:40
484
原创 ML-朴素贝叶斯-先验分布/后验分布/似然估计
文章目录引言概念后验分布朴素贝叶斯朴素在哪里?[逻辑回归与朴素贝叶斯有什么区别](https://www.zhihu.com/question/265995680)朴素贝叶斯的参数估计极大似然估计贝叶斯估计引言介绍先验分布/后验分布/似然估计参考 一个例子搞清楚(先验分布/后验分布/似然估计)概念故事:隔壁小哥要去15公里外的一个公园,他可以选择步行走路,骑自行车或者开辆车,然后通过其...
2019-02-21 22:13:07
2088
原创 ML-数据分析模板
文章目录机器学习-数据分析模板ObjectiveData Set Information:Attribute Information:Input单特征分析机器学习-数据分析模板Objective我们的任务:预测一个人的收入能否超过五万美元人口普查数据集: https://archive.ics.uci.edu/ml/datasets/adultData Set Information:...
2019-02-20 15:00:51
2158
1
原创 分布式爬虫学习笔记
安装python 虚拟环境 (将使用python2/3的项目分开) 1、安装virtualenvcmd cmd命令:pip install virtualenv 2、因为下载开发包很慢,所以下载开发包的第三方镜像--python豆瓣源(百度) 安装djangio cmd命令:pip install -i
2017-08-13 15:11:25
502
原创 frame:通过鼠标拉动两个子页面的宽度
除了本文,还可以参考https://www.cnblogs.com/LT0314/p/3805393.html1、只需要简单的frame标签即可实现鼠标拉动调整大小的效果:<html><frameset cols="25%,50%,25%"> <frame src="frame_a.htm" /> <frame src="frame_b.htm...
2017-08-13 14:04:53
1225
原创 生成xml
第一个是原创的,在读取模板xml文件,然后添加内容第二个是转载的,直接创建xml文件,引用http://blog.youkuaiyun.com/hzc543806053/article/details/7310418/package TestPMD;import java.io.File;import java.io.FileOutputStream;import java.io.Output
2017-08-12 15:18:16
364
转载 xml 遍历某个节点
A1234 四川省XX县XX镇XX路X段XX号 B1234 四川省XX市XX乡XX村XX组import java.io.File;import java.io.IOException;import java.util.Iterator;import org.dom4j.Document;import org.dom4j.Element;import
2017-08-08 16:45:01
1763
转载 dom4j语法(xml)
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还
2017-08-08 16:37:37
481
原创 c/c++重要函数总结
1、strcmp函数i=strcmp(字符串,字符串); 其中,字符串1、字符串2均可为字符串常量或变量;i 是用于存放比较结果的整型变量①字符串1小于字符串2,strcmp函数返回一个负值;②字符串1等于字符串2,strcmp函数返回零;③字符串1大于字符串2,strcmp函数返回一个正值;struct Student{ char no[100]; int
2017-08-07 17:22:06
350
原创 慕课网学习笔记Maven+ssm
源码:https://github.com/codingXiaxw/seckill一、创建Maven项目 修改web.xml,将servlet2.3改为servlet3.1,可以从tommcat->examples找3模板二、DAO层: Mybatis: 设计数据库 建包org.Example.entiy 建包
2017-08-07 17:19:37
531
原创 正则表达式
1.编程中如何区分两种模式 默认是贪婪模式; 在量词后面直接加上一个问号?就是非贪婪模式。 量词:{m,n}:m到n个 *:任意多个 +:一个到多个 ?:0或一个2、正则表达式默认用的是贪婪模式 贪婪模式就是尽可能的让数量最多,正则表达式里要满足的顺序就是从左到右 "suMen
2017-08-07 17:16:24
338
原创 PAT 甲级 Highest Price in Supply Chain (25)
Highest Price in Supply Chain (25)参考来源:http://blog.youkuaiyun.com/zhangpiu/article/details/50788589 感觉这个写的不错,于是拿下来学习 #include #include #include #include
2017-07-22 18:36:26
403
原创 “servlet监听器”以及在web.xml中的配置
监听器:监听器就是一个java程序,功能是监听另一个java对象变化(方法调用、属性变更)以上是普通监听器,下面开始研究servlet监听器: 注册监听器只需要配置到web.xml中就行servlet 监听器:8个监听器(准确说是8个接口),分为了3种 步骤一:写一个类实现相应的接口 package com.itheima.lis
2017-07-18 12:37:01
6567
原创 servlet
一、Servlet概述 1.sun公司提供的动态web资源开发技术。本质是上一段java小程序,要求这个小程序必须实现Servlet接口,以便服务器能够调用。 但是我们并不知道servlet这个接口里到底规定了哪些方法,sun公司提供了几个已经实现了servlet接口的几个类:FacesServlet,GenericServlet, Http
2017-07-17 21:13:33
283
原创 git冲突、提交
git冲突 本文是从类似svn功能角度出发来看问题,对分支没有涉及环境:IDE idea情况:用户甲 用户乙甲对某一代码串进行了修改,提交。 然后乙对同一代码串修改,提交,这时乙会提示出现冲突,然后是截图上的操作即使进行上图的操作,最后依然提示push rejected ,即推送到了本地仓库,但是没有推送到远程仓库。解决方法:
2017-07-15 17:04:09
418
原创 springMVC 上传压缩包文件、解压
参考目录:http://www.cnblogs.com/lvgg/p/6674916.html没有直接用以上的代码,因为直接引用会有一些错误。eclipse tomcat jar包: 1、如果是maven项目, org.apache.ant ant 1.
2017-07-14 20:45:05
7684
原创 jar包
1、问: 经常在SSH中出现jar包冲突 不知是Referenced Libraries 中的jar文件冲突 还是 WebRoot /web-inf/ lib 下jar文件冲突???解答:编译期冲突是由Referenced Libraries中jar包冲突引起;运行期冲突是由 WebRoot /web-inf/ lib 下jar文件冲突引起的。首先 Referenced Lib
2017-07-13 21:25:37
269
原创 题目1002:Grading
题目描述: Grading hundreds of thousands of Graduate Entrance Exams is a hard work. It is even harder to design a process to make the results as fair as possible. One way is to assign each exam probl
2017-07-13 15:29:51
343
原创 九度OJ
这个题的意思是:两个矩阵A,B,相加后得到矩阵C,求C中行或列全为0的总和。。样例输入: 2 21 11 1-1 -110 92 31 2 34 5 6-1 -2 -3-4 -5 -60样例输出: 15#include#includeusing namespace std;int Rows(int matrics[10][1
2017-07-13 14:41:20
683
原创 静态代码分析
静态程序分析先来说说什么是“静态程序分析(Static program analysis)”,静态程序分析是指使用自动化工具软件对程序源代码进行检查,以分析程序行为的技术,应用于程序的正确性检查、安全缺陷检测、程序优化等。它的特点就是不执行程序,相反,通过在真实或模拟环境中执行程序进行分析的方法称为“动态程序分析(Dynamic program analysis)”。那在什么情况下需要进行
2017-07-13 11:16:26
970
原创 初次在idea运行ssm框架项目
JDK 8Tomcat 8Maven 最新的 配环境变量GitIDEA 安装 陪环境:编码(UTF-8),快捷方式,把自己安装的JDK,Tomcat,Maven,git配置到IDEA中,自己下一些插件 从GitHub上倒入项目(Maven格式的)Mysql 5.7 项目的sql文件倒入修改项目里的数据库配置(用户
2017-07-11 13:48:15
3919
原创 2017-7-11北京_运行ssm框架项目前的准备
JDK 8Tomcat 8Maven 最新的 配环境变量GitIDEA 安装 陪环境:编码(UTF-8),快捷方式,把自己安装的JDK,Tomcat,Maven,git配置到IDEA中,自己下一些插件 从GitHub上倒入项目(Maven格式的)Mysql 5.7 项目的sql文件倒入修改项目里的数据库配置(用户
2017-07-11 13:44:23
453
原创 hdu 空心三角形(输入、输出格式的问题)
Problem Description把一个字符三角形掏空,就能节省材料成本,减轻重量,但关键是为了追求另一种视觉效果。在设计的过程中,需要给出各种花纹的材料和大小尺寸的三角形样板,通过电脑临时做出来,以便看看效果。 Input每行包含一个字符和一个整数n(0 Output每个样板三角形之间应空上一行,三角形的中间为空。显然行末没有多余的空格。
2017-04-06 20:53:10
1201
转载 acm 考试排名(比较麻烦)
考试排名 另一种 解法,比较麻烦,他是先把所有输入全都输入到变量里,然后再分析变量,把字符串拆分、把字符串转化称整数,然后再比较#include #include #include using namespace std; struct STU { char name[20]; int sum;
2017-03-20 10:49:45
2234
转载 hdu 考试排名(比较简单)
考试排名问题描述 :C++编程考试使用的实时提交系统,具有即时获得成绩排名的特点。它的功能是怎么实现的呢?我们做好了题目的解答,提交之后,要么“AC”,要么错误,不管怎样错法,总是给你记上一笔,表明你曾经有过一次错误提交,因而当你一旦提交该题“AC”后,就要与你算一算帐了,总共该题错误提交了几回。虽然你在题数上,大步地跃上了一个台阶,但是在耗时上要摊上你共花去的时间。特别是
2017-03-20 10:39:45
953
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人